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(54) Title: QUALITATIVE DIFFERENTIAL SCREENING 
(54) Titre: CRIBLAGE DIFFERENTIEL QUALITATIF 
(57) Abstract 

The invention concerns a method for identifying and/or cloning nucleic acid regions representing qualitative differences associated 
with alternative splicing events and/or with insertions, deletions located in RNA transcribed genome regions, between two physiological 
situations comprising either hybridisation of RNA derived from the test situation with cDNA's derived from the reference situation ano/or 
reciprocally, or double-strand hybridisation of cDNA derived from the test situation with cDNA's derived from the reference situation; and 
identifying and/or cloning nucleic acids representing qualitative differences. The invention also concerns compositions or banks of nucleic 
acids representing qualitative differences between two physiological situations, obtainable by the above method, and their use as probe, 
for identifying genes or molecules of interest, or still for example in methods of pharmacogenomics, and profiling of molecules relative to 
their therapeutic and/or toxic effects. The invention further concerns the use of dysregulation of splicing RNA as markers for predicting 
molecule toxicity and/or efficacy, and as markers in pharmacogenomics. 

(57) Abrege* 

L'invention concerne un precede* d' identification et/ou de clonage de regions d'acides nuclelques representatives de differences 
qualitative^ associees a des evenements d'epissages alternatifs et/ou a des insertions, deletions se trouvant dans des regions du genome 
transcrites en ARN, entre deux situations physiologiques, comprenant soit l'hybridation d'ARN provenant de la situation test avec les 
ADNc provenant de la situation de reference et/ou reciproquement, soit l'hybridation d'ADNc double-brin provenant de la situation test 
avec les ADNc provenant de la situation de reference et V identification et/ou le clonage d'acides nucteiques representatifs des differences 
qualitatives. L'invention concerne egalement des compositions ou banques d'acides nucieiques representatifs de differences qualitatives 
entre deux situations physiologiques, susceptibles d'etre obtenues par le proedde" decrit ci-<lessus f ainsi que leur utilisation comme sonde, 
pour T identification de genes ou molecules dMnt&et, ou encore par exemple dans des m6thodes de pharmacogenomique, et de profilage de 
molecules vis a vis de leurs effets th6rapeutiques et/ou toxiques. L'invention concerne aussi l'utilisation des dysregulations de repissage des 
ARN comme marqueurs de prediction de la toxicite et/ou de l'efficacite de molecules, ainsi que comme marqueurs de pharmacogenomique 
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CRIBLAGE PIFF^RENTIEL QUALITATIF 
Cette invention se rapporte aux domaines techniques de la 
biotechnologie, de la medecine, dela biologie et de la biochimie. Ses 
applications concernent les domaines de la sante humaine, animale et 

5 vegetale. Plus particulierement, I' invention permet d' identifier des sequences 
d'acides nucleiques permettant de concevoir de nouveaux cribles pour 
molecules d'int6r§t therapeutique, de nouveaux outils de therapie genique 
ainsi que d'apporter des indications sur le potentiel toxique et le suivi 
d'efficacite de molecules et des informations de pharmacogenomique. 

10 La presente invention decrit notamment une serie de 

techniques originales d' identification de sequences d'acides nucleiques 
basee sur la mise en evidence des differences qualitatives entre les ARN 
issus de deux contextes differents que Ton desire comparer, en particular 
issus d'un tissu ou d'un organe malade et leur equivalent sain. Plus 

is pr6cis6ment, ces techniques sont destinees a doner specifiquement les 
introns et les exons alternatifs 6pisses differentiellement entre une situation 
pathologique et un etat sain ou entre deux situations physiologiques que Ton 
desire comparer. Ces differences qualitatives au sein des ARNs peuvent 
egalement provenir d'alteration(s) du genome, de type insertions ou 

20 deletions dans des regions qui seront transcrites en ARN. Cette serie de 
techniques est identiftee par Tacronyme DATAS : Differential Analysis of 
Transcripts with Alternative Splicing. 

La caracterisation des alterations de Texpression gen&ique qui 
president ou sbnt associees a une pathologie donnee suscite un espoir 

25 important de d6couvrir de nouvelles cibles therapeutiques et de nouveaux 
outils diagnostiques. Toutefois, T identification d'une sequence d'ADN 
genomique ou complementaire, qu'elle ait lieu par clonage positionnel ou par 
des techniques de criblage differentiel quantitatif, n'apporte que peu ou pas 
d'information sur la fonction et encore moins sur les domaines fonctionnels 

30 mis en jeu dans les deregulations liees a la pathologie etudiee. La presente 
invention decrit une serie de techniques originales qui visent a identifier les 
differences d'epissages des ARNs qui existent entre deux situations 
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physiopathologiques distinctes. L'identification de ces differences apporte 
des informations sur les differences qualitatives et non sur les differences 
quantitatives comme c'est le cas pour les techniques decrites jusqu'a 
present. L'ensemble des techniques presentees dans la presente invention 
5 sont done regroupees sous Tappellation "criblage differentiel qualitatif ou 
DATAS. Les methodes de invention sont utilisables pour l'identification de 
nouvelles cibles ou produits therapeutiques, pour la preparation d'outils de 
recherche genetique et/ou d'outils de diagnostic, pour la construction de 
banques d'acides nucleiques, et dans des methodes de determination du 

10 profit toxicologique ou de I'efficacite d'un compose par exemple. 

Un premier objet de 1'invention reside plus particulierement 
dans un precede d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences genetiques qualitatives entre deux 
echantillons biologiques, comprenant une etape d'hybridation d'une 

is population d'ARN ou d'ADNc double-brin provenant d'un premier echantillon 
biologique avec une population d'ADNc provenant d'un deuxieme echantillon 
biologique (Figure 1A). 

Comme indique ci-avant, les differences genetiques qualitatives 
peuvent etre dues a des modifications d'epissage des ARN ou a des 

20 deletions et/ou insertions dans des regions du genome qui sont transcrites 
en ARN. 

Dans un premier mode de realisation, il s'agit d'une hybridation 
entre une population d'ARN provenant d'un premier echantillon biologique et 
une population d'ADNc (simple-brin ou double-brin) provenant d'un deuxieme 

25 Echantillon biologique. 

Dans un autre mode de realisation, il s'agit d'une hybridation 
entre une population d'ADNc double-brin provenant d'un premier echantillon 
biologique et une population d'ADNc (double-brin ou, preferentiellement 
simple-brin) provenant d'un deuxieme echantillon biologique. 

30 Un objet plus particulier de I'invention reside dans un procede 

d'identification de regions d'acides nucleiques epissees differentiellement 
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entre deux situations physiologiques, comprenant I'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'une situation test avec 
une population d'ADNc provenant d'une situation de reference et 
identification d'acides nucleiques correspondant a des epissages 
5 differentiels. 

Un autre objet de Tinvention concerne un procede de clonage 
d'acides nucleiques episses differentiellement entre deux situations 
physiologiques, comprenant I'hybridation d'une population d'ARN ou d'ADNc 
double-brin provenant de la situation test avec une population d'ADNc 
10 provenant de la situation de reference et le clonage d'acides nucleiques 
correspondant a des epissages differentiels. 

Dans un mode particulier de mise en ceuvre, le procede 
d'identification et/ou de clonage d'acides nucleiques de 1'invention comprend 
deux hybridations paralleles : 
15 (a) I'hybridation des ARN provenant du premier echantillon 

(situation test) avec les ADNc provenant du deuxieme echantillon (situation 
de reference); 

(b) I'hybridation des ARN provenant du deuxieme echantillon 
(situation de reference) avec les ADNc provenant du premier echantillon 

20 (situation test); et 

(c) ^identification et/ou le clonage, a partir des hybrides formes 
en (a) et (b) d'acides nucleiques correspondant a des differences genetiques 
qualitatives. 

La presente invention concerne egalement la preparation de 
25 banques d'acides nucleiques, les acides nucleiques et banques ainsi 
obtenus, ainsi que les utilisations de ces materiels dans tous les domaines 
de la biologie/biotechnologie, comme illustre plus loin. 

A cet egard, Pinvention est egalement relative 3 un procede de 
preparation de compositions ou banques d'acides nucleiques profilees, 
30 representatives des differences qualitatives existant entre deux echantillons 
bioiogiques, comprenant une §tape d'hybridation d'une population d'ARN 
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provenant cTun premier echantillon biologique avec une' population d'ADNc 
provenant d r un deuxieme echantillon biologique. 

(.'invention concerne en outre une methode de profilage 
("profiling") d'une composition d'ADNc, comprenant une etape d'hybridation 
5 de cette composition avec une population d'ARN, ou inversement. 

Comme indique ci avant, la presente invention concerne en 
particulier des methodes d'identification et de clonage d'acides nucleiques 
representatifs d'un etat physiologique. En outre, les acides nucleiques 
identifies et/ou clones represented les qualites d'un etat physiologique en ce 

10 sens que ces acides nucleiques sont generalement en grande partie 
impliques dans I'etat physiologique observe. De ce fait, les methodes 
qualitatives de I'invention donnent acces directement aux elements 
genetiques ou a leur produit proteique, ayant un role fonctionnel dans le 
developpement d'un etat physiopathologique. 

15 Les methodes selon I'invention reposent en partie sur une 

etape originate d'hybridation croisee entre des ARN et des ADNc de 
situations physiologiques differentes. Cette ou ces hybridations croisees 
permettent avantageusement de mettre en evidence, dans les hybrides 
formes, des regions non appariees, c'est-a-dire des regions presentes dans 

20 les ARNs dans une situation physiologique donnee et pas dans les ARNs 
dans une autre situation physiologique. Ces regions correspondent 
essentiellement a des epissages altematifs caracteristiques d'un etat 
physiologique, mais peuvent egalement refleter des alterations genetiques 
de type insertions ou deletions, et constituent ainsi des elements genetiques 

25 particulierement utiles sur le plan therapeutique ou diagnostic comme 
expiique ci-apres. L'invention consiste done notamment a conserver les 
complexes formes apres hybridation(s) croisee(s), afin d'en extraire les 
regions correspondant a des differences qualitatives. Cette methodologie se 
difference des techniques de soustractions quantitatives connues de 

30 Thomme de Tart ( Sargent and Dawid (1983), Science, 222, 135-139 ; Davis 
et.al. (1984), PNAS, 81, 2194-2198 ; Duguid and Dinauer (1990) Nuc. Acid 
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Res., 18, 2789-2792 ; Diatchenko et.al. (1996) PNAS, 93, 6025-6030), qui 
apres hybridation(s), eliminent les hybrides formes pour ne conserver que les 
acides nucleiques non complexes. 

[.'invention concerne done en premier lieu un procede 
5 d'identification d'acides nucleiques d'interet comprenant Fhybridation entre 
les ARN d'un echantillon test et les ADNc d'un echantillon de reference. 
Cette hybridation permet de mettre en evidence, au sein des complexes 
formes, des differences genetiques qualitatives entre les situations testees, 
et ainsi d'identifier et/ou de doner par exemple les epissages 

10 caracteristiques de la situation test. 

Selon une premiere variante de I'invention, le procede permet 
done de generer une population d'acides nucleiques caracteristiques des 
epissages de I'etat physiologique test par rapport a I'etat de reference (Figure 
1A, 1B). Comme indique ci-apres, cette population peut etre utilisee pour le 

is clonage et la caracterisation des acides nucleiques, leur utilisation en 
diagnostic, criblage, therapeutique ou pour la production d'anticorps ou de 
fragments proteiques ou de proteines entieres. Cette population peut 
egalement servir a la constitution de banques utiiisables dans differents 
domaines duplications illustres plus loin et a la realisation de sondes 

20 marquees (Figure 1 D). 

Selon une autre variante de Tinvention, le procede comprend 
une premiere hybridation telle que decrite ci avant et une seconde 
hybridation, en parallele, entre les ARN provenant de la situation de 
reference et les ADNc provenant de la situation test. Cette variante est 

25 particulierement avantageuse puisqu'elle permet de generer deux 
populations d'acides nucleiques, Tune repr6sentant les qualites de la 
situation test par rapport a la situation de reference, et I'autre les qualites de 
la situation de reference par rapport a la situation test (Figure 1C). Ces deux 
populations peuvent egalement etre utilisees comme source d'acides 

30 nucleiques, ainsi que comme banques temoignant de I'empreinte genetique 
d'une situation physiologique donnee, comme detaille plus loin (Figure 1D). 
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La presente invention peut etre appliquee a tous types 
d'echantilions biologiques. En particulier, I'echantillon biologique peut etre 
toute cellule, organe, tissu, pr6levement, biopsie, etc., contenant des acides 
5 nucleiques. S'agissant d'un organe, tissu ou biopsie, ils sont eventuellement 
mis en culture de maniere a permettre faeces aux cellules qui les 
composent. II peut s'agir d'echantilions provenant de mammiferes (en 
particulier I'homme), de vegetaux, de bacteries ou de cellules eucaryotes 
inferieures (levures, cellules fongiques, etc.). Des exemples de materiels 

10 sont en particulier une biopsie de tumeur, une biopsie de plaques 
neurodegeneratives ou d'aires cerebrates presentant des atteintes 
neurodegeneratives, un echantillon de peau, un echantillon de cellules 
sanguines obtenues apres prise de sang, une biopsie colorectal, des 
biopsies issues de lavages pulmonaires, etc. Des exemples de cellules sont 

15 notamment les cellules musculaires, hepatiques, fibroblastes, nerveuses, de 
Tepiderme, du derme, des cellules sanguines comme les lymphocytes B, T, 
les mastocytes, les monocytes, les granulocytes, les macrophages. 

Comme indique ci avant, le criblage differentiel qualitatif selon 
la presente invention permet d'identifier des acides nucleiques 

20 caracteristiques d'une situation physiologique donnee (situation B) par 
rapport a une situation physiologique de reference (situation A), en vue de 
leur clonage ou autres utilisations. A titre illustratif, les situations 
physiologiques A et B etudiees peuvent etre les suivantes : 



Situation A 


Situation B 


echantillon sain 


echantillon pathologique 


echantillon sain 


Echantillon apoptotique 


echantillon sain 


echantillon apres. infection virale 


echantillon sensible a X 


echantillon resistant a X 
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echantillon non traite 


Echantillon traite (par exemple 
par compose toxique) 


echantillon non differencie 


echantillon ayant subi une 
differentiation cellulaire ou 
tissulaire 



Populations d'ARN 

Pour la mise en ceuvre de la presente invention, il est possible 
5 d'utiliser des ARN totaux ou les ARN messagers. Ces ARN peuvent etre 
prepares par toutes methodes classiques de biologie moleculaire, bien 
connues de rhomme du metier. Ces methodes comprennent generalement 
une lyse des cellules ou tissu ou echantilions et I'isolement des ARNs par 
des techniques d'extraction. II peut s'agir en particulier d'un traitement au 

10 moyen d'agents chaotropiques tels que le thiocyanate de guanidium (qui 
detruit les cellules et protege les ARN) suivi d'une extraction des ARN au 
moyen de solvants (phenol, chloroforme par exemple). De telles methodes 
sont bien connues de rhomme du metier (voir Maniatis et al., Chomczynski et 
aL, Anal. Biochem. 162 (1987) 156). Ces methodes peuvent etre aisement 

15 pratiquees en utilisant des kits disponibles dans le commerce tels que par 
exemple le kit US73750 (Amersham) ou le kit Rneasy (Quiagen) pour les 
ARN totaux. II n'est pas necessaire que les ARN utilises soient parfaitement 
purs, et notamment il n'est pas genant que des traces d'ADN genomique ou 
d'autres composants cellulaires (proline, etc.) subsistent dans les 

20 preparations, des lors qu'ils n'affectent pas significativement la stabilite des 
ARNs et que les modes de preparation entre les differents echantilions a 
comparer soient les memes. En outre, de maniere facultative, il est possible 
d'utiliser non pas des preparations d f ARN totaux mais des preparations 
d'ARN messagers. Ceux-ci peuvent Etre isoles, soit directement a partir de 

25 I'echantillon biologique soit a partir des ARN totaux, au moyen de sequences 
polyT, selon les methodes classiques. Uobtention d'ARN messagers peut £ 
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cet egard etre realisee au moyen de kits commerciaux tels que par exemple 
le kit US72700 (Amersham) ou le kit utilisant des billes oligo-(dT) (Dynal). Un 
mode avantageux de preparation d'ARN consiste a extraire !es ARN 
cytosoliques puis les ARN polyA+ cytosoliques. Des kits permettant la 
5 preparation selective d'ARN cytosoliques non contamines avec des ARN 
pr6messagers porteurs d'exons et d'introns non episses sont disponibles 
dans le commerce. C'est le cas notamment des kits Rneasy commercialises 
par Qiagen (exemple de reference: 74103). Les ARN peuvent egalement 
etre obtenus directement a partir de banques ou autres echantillons prepares 

10 a Pavance et/ou accessibles dans des collections, conserves dans des 
conditions appropriees. 

Generalement, les preparations d'ARN utilisees comprennent 
avantageusement au moins 0,1 pg d'ARN, de preference au moins 0,5pg 
d'ARN. Les quantites peuvent varier selon les cellules et les methodes 

15 utilisees, sans modifier la mise en oeuvre de la presente invention. Pour 
obtenir des quantites d'ARN suffisantes (de preference 0,1 pg au moins), il 
est generalement recommande d'utiliser un echantillon biologique 
comprenant au moins 10 5 cellules. A cet egard, une biopsie classique 
comprend generalement entre 10 5 et 10 8 cellules, et une culture cellulaire sur 

20 boite de petri classique (diametre 6-10 cm) comporte de I'ordre de 10 6 
cellules, ce qui permet d'obtenir aisement des quantites d'ARN suffisantes. 

Les preparations d'ARN peuvent etre utilisees 
extemporanement ou etre conservees, de preference au froid, en solution ou 
congelees, pour des utilisations ulterieures. 

25 

Populations d'ADNc 

Les ADNc utilises dans le cadre de la pr6sente invention 
peuvent etre obtenus par transcription inverse selon les techniques 
classiques de biologie moleculaire. On peut se referer notamment & Maniatis 
30 et al. La transcription inverse est generalement r6alisee en utilisant une 
enzyme, transcriptase inverse ("reverse transcriptase") et une amorce. 
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A cet egard, de nombreuses transcriptases inverses ont 6te 
decrites dans la litterature et sont disponibles dans le commerce (Kit 
1483188, Boehringer). On peut citer a titre d'exemples les transcriptases 
inverses les plus souvent utilisees comme celles du virus aviaire AMV (Avian 
5 Myeloblastosis Virus) et du virus de leucemie murine MMLV (Moloney Murine 
Leukemia Virus). II convient egalement de citer certaines DNA polymerase 
thermostables douees d'activite transcriptase inverse telles celles isolees de 
Thermus flavus et de Thermus thermophilus HB-8 (commercialement 
disponibles; references Promega M1941 et M2101). Selon une variante 

10 avantageuse, on utilise pour la mise en oeuvre de la presente invention la 
transcriptase inverse d'AMV puisque cette enzyme, fonctionnant a 42°C 
(contrairement a celle de MMLV qui fonctionne a 37°C), destabilise certaines 
structures secondaires des ARN qui pourraient bloquer Pelongation, et 
permet ainsi la transcription inverse d'ARN de longueur importante, et permet 

15 d'avoir des preparations d'ADNc representant les ARN avec une grande 
fidelite et une grande efficacite. 

Selon une autre variante avantageuse de [Invention, on utilise une 
transcriptase inverse depourvue d'activite RNaseH. Utilisation de ce type 
d'enzyme offre plusieurs avantages, et notamment celui d'augmenter le 

20 rendement de synthese des ADNc et de prevenir toute degradation des 
ARN, qui seront ensuite engages dans des heteroduplex avec les ADNc 
neosynthetises, permettant ainsi eventuellement de se passer de I'extraction 
phenolique de ceux ci. Les transcriptases inverses depourvues d'activite 
RNaseH peuvent etre preparees a partir de toute transcriptase inverse par 

25 deletion(s) et/ou mutagenese. En outre, de telles enzymes sont Egalement 
disponibles dans le commerce (par exemple Life Technologies, reference 
18053-017). 

Les conditions de mise en oeuvre des transcriptases inverses 
(concentration et temperature) sont bien connues de I'homme du metier. En 
30 particulier, on utilise gSneraiement de 10 a 30 Unites d f enzyme par reaction, 
en presence d'une concentration optimale en Mg 2 * de 10 mM. 
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La ou les amorces utilises pour la transcription inverse 
peuvent etre de natures differentes. II peut s'agir en particulier d'un 
oligonucleotide aleatoire ("random") comprenant de preference entre 4 et 10 
5 nucleotides, avantageusement un hexanucleotide. ^utilisation de ce type 
d'amorce aleatoire a et6 decrite dans la litterature et permet d'initier la 
transcription inverse en differentes positions au hasard au sein des 
molecules d'ARN. Cette technique est surtout employee pour la transcription 
inverse d'ARN totaux (c'est-a-dire comprenant les ARNm, les ARNt et les 

io ARNr notamment). Dans le cas ou Ton souhaite realiser la transcription 
inverse des ARNm seulement, il est avantageux d'utiliser comme amorce un 
oligonucleotide oligo dT, qui permet d'initier la transcription inverse a partir 
des queues polyA specifiques des ARN messagers. ^oligonucleotide oligo 
dT peut comprendre de 4 a 20-meres, avantageusement de 15-meres 

is environ. L'emploi de ce type d'amorce constitue un mode de realisation 
prefere de ['invention. D'autre part, il peut etre avantageux d'utiliser pour la 
transcription inverse une amorce marquee. Ceci peut en effet permettre de 
reconnaitre et/ou de selectionner et/ou de trier ulterieurement les ARN des 
ADNc. Ceci peut egalement permettre d'isoler les heteroduplex ARN/ADN 

20 dont la formation represente une etape clef de 1'invention. Le marquage de 
I'amorce peut consister en tout systeme de type ligand-recepteur, c'est-a-dire 
permettant par affinite de separer les molecules portant I'amorce. II peut 
s'agir par exemple d'un marquage par la biotine, qui peut etre separe par tout 
support (bille, colonne, plaques, etc.) sur lequel est fixee la streptavidine. 

25 Tout autre systeme de marquage permettant cette separation sans affecter 
les proprietes d'amorce peut etre utilise de maniere equivalente. 

Dans les conditions habituelles de mise en oeuvre, cette 
transcription inverse genere des ADN complementaires (ADNc) simple-brins. 
Ceci constitue un premier mode avantageux de la presente invention. 

30 Dans une deuxieme variante de mise en oeuvre, la transcription 

inverse est reaiisee de maniere a preparer des ADNc double-brins. Pour ce 
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faire, apres transcription du premier brin d'ADNc, le deuxieme brin peut etre 
gener6 selon les techniques classiques de biologie moleculaire faisant 
intervenir des enzymes de modification de I'ADN comme I'ADN Ligase du 
phage T4, I'ADN polymerase I et I'ADN polymerase du phage T4. 

Les preparations d'ADNc peuvent etre utilises 
extemporanement ou etre conservees, de preference au froid, en solution ou 
congel£es, pour des utilisations ulterieures. 

Hybridation? 

Comme explique ci-avant, les methodes selon Tinvention 
reposent en partie sur une etape originale d'hybridation croisee entre les 
ARN et les ADNc provenant d'echantillons biologiques dans des situations 
physiologiques ou d'origines differentes. Dans un mode de realisation 
prefere, l'hybridation selon I'invention est avantageusement reaiisee en 
phase liquide. En outre, elle peut etre effectuee dans tout dispositif 
approprie, tel que par exemple des tubes (Eppendorff, par exemple), des 
plaques, ou tout autre support adapte et couramment utilise en Biologie 
Moleculaire. L'hybridation est avantageusement reaiisee dans des volumes 
compris entre 10 et 1000 pi, par exemple entre 10 et 500 pi. II est entendu 
que le dispositif utilise et les volumes utilises peuvent etre aisement adaptes 
par I'homme du metier. Les quantites d'acides nucleiques utilisees pour 
l'hybridation sont egalement connues de I'homme du metier. En general, il 
est suffisant d'utiliser des microgrammes d'acides nucleiques, par exemple 
de I'ordrede 0,1 a 100 pg. 

Un element plus important dans la mise en oeuvre des 
hybridations reside dans les quantites respectives d'acides nucleiques 
utilisees. Ainsi, il est possible d'utiliser les acides nucleiques dans un rapport 
ADNc/ARN variant de 50 a 0,02 environ, de preference de 40 a 0,1. De 
maniere plus particulierement avantageuse, on pr6fere que le rapport 
ADNc/ARN soit proche ou superieur a 1. En effet, dans ces experiences, 
I'ARN constitue le compose test ("tester") et I'ADNc constitue le porteur 
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("driver"). De ce fait, dans le but d'ameliorer la specificite de la methode, il est 
preferable d'operer dans des conditions ou le "driver" se trouve en exces par 
rapport au 'tester". En effet, dans ces conditions, Teffet de cooperative entre 
les acides nucleiques joue et les appariements non-parfaits sont fortement 
5 defavorises. De ce fait, les seuls mesappariements qui apparaissent sont 
generalement dus £ la presence de regions dans les ARN "tester" qui 
n'existent pas dans I'ADNc "driver" et qui sont done specifiques. Pour 
favoriser la specificite du precede, Thybridation est done avantageusement 
realisee a un rapport ADNc/ARN compris entre 1 environ et 10 environ. II est 

10 bien entendu que ce rapport peut etre adapte par Thomme du metier selon 
les conditions du procede (quantites d'acides nucleiques disponibles, 
situations physiologiques, but poursuivi, etc.). Les autres parametres de 
Thybridation (temps, temperature, force ionique) sont egalement adaptables 
par Thomme du metier. De maniere generate apres denaturation des "tester" 

is et "driver" (par chauffage par exemple), Thybridation est realisee pendant 
environ 2 a 24 heures, a une temperature de 37°C environ (eventuellement 
soumise a des sauts de temperature comme decrit plus loin), et dans des 
conditions standard de force ionique (pouvant varier de 0,1 a 5M NaCI par 
exemple). II est connu que la force ionique est un des facteurs determinant la 

20 stringence d'une hybridation, notamment dans le cas d'hybridation sur 
support solide. 

Selon un mode de mise en oeuvre particulier de ('invention, 
Thybridation est realisee en emulsion phenolique, par exemple selon la 
technique PERT ("Phenol Emulsion DNA Reassociation Technique) decrite 

25 par Kohne D.E. et al. (Biochemistry, Vol. 16, N° 24, pp 5329-5341, 1977). 
Avantageusement, on utilise dans le cadre de la presente invention 
Thybridation en emulsion phenolique maintenue par thermocycles (sauts de 
temperature de 37°C environ a 60/65°C environ) et non par agitation, selon 
la technique decrite par Miller et Riblet (NAR 23 (1995) 2339). Toute autre 

30 technique d'hybridation en phase liquide, notamment en emulsion, peut etre 
utilisee dans le cadre de la presente invention. Ainsi, dans un autre mode 
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particulierement avantageux, ('hybridation est realisee dans une solution 
contenant 80% de formamide, a une temperature de 40°c par exemple. 

L'hybridation peut egalement se faire avec 1'un des partenaires 
immobilise sur un support. Avantageusement, c'est I'ADNc qui est 
5 immobilise. Cela peut etre realise en tirant profit du marquage dont peuvent 
faire I'objet les ADNc (voir ci-dessus) notamment grace a des amorces 
biotinylees. Les groupements biotine sont mis en presence de billes 
magn6tiques sur lesquelles sont fixees des molecules de streptavidine. Les 
ADNc peuvent ensuite etre maintenus grace a un aimant au contact d'un 

10 filtre ou d'un puits de plaque de microtitration. Les ARN sont ensuite, dans 
les conditions de force ionique requise, mis en presence des ADNc. Les ARN 
non apparies sont elimines par lavage. Les ARN hybrides ainsi que les ADNc 
sont recuperes par retrait du champ magnetique. 

Dans le cas ou I'ADNc est double-brin, les conditions 

is d'hybridation utilisees sont essentiellement similaires a celles decrites ci- 
dessus, et adaptables par I'homme du metier. On prefere dans ce cas 
proceder a I'hybridation en presence de formamide et on expose les 
complexes a une gamme de temperatures allant par exemple de 60 a 40 °C, 
preferentiellement de 56 °C a 44 °C, afin de favoriser la formation de 

20 complexes de type R-loop. De plus, il est souhaitable d'ajouter, apres 
I'hybridation, un agent de stabilisation des triplex formes, une fois la 
formamide retiree du milieu, tels que le glyoxal par exemple (Kaback et.al. 
(1979) Nuc. Acid Res., 6, 2499-2517). 

Ces hybridations croisees selon Tinvention generent ainsi des 

25 compositions comprenant des heteroduplex ou heterotriplex ADNc/ARN, 
representant les qualites de chacune des situations physiologiques testees. 
Comme indique ci-avant, dans chacune de ces compositions, des acides 
nucl6iques correspondant essentiellement a des epissages alternatifs 
differentiels ou a d'autres alterations gen6tiques, specifiques de chaque 

30 situation physiologique, peuvent etre identifies et/ou clones. 

L'invention concerne done avantageusement un proced6 
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^identification et/ou de clonage de regions decides representatives de 
differences genetiques entre deux situations physiologiques, comprenant 
une etape d'hybridation entre les ARN provenant d'un echantillon biologique 
dans une premiere situation physiologique et les ADNc simple-brins 
5 provenant d'un echantillon biologique dans une deuxieme situation 
physiologique, et Identification et/ou le clonage, a partir des hybrides ainsi 
formes, des regions d'ARN non-appariees. 

Cette premiere variante repose plus particulierement sur la 
formation d'heteroduplex entre les ARN et les ADNc simple-brin (voir Figures 

10 2-4). Cette variante est avantageusement mise en oeuvre en utilisant des 
ARN messagers ou des ADNc produits par transcription inverse des ARN 
messagers essentieliement, c'est-a-dire en presence d'une amorce oligo dT. 

Dans un mode particulier de mise en oeuvre, le procede 
d'identification et/ou de clonage d'acides nucleiques de Pinvention 

15 comprend : 

(a) ('hybridation d'ARN provenant de la situation test avec les 
ADNc simple-brin provenant de la situation de reference; 

(b) I'hybridation d'ARN provenant de la situation de reference 
avec les ADNc simple-brin provenant de la situation test; et 

20 (c) ['identification et/ou le clonage, a partir des hybrides formes 

en (a) et (b), de regions d'ARN non-appariees. 

Dans une variante particuliere de mise en oeuvre, le proced§ 
de I'invention comprend les etapes suivantes : 

(a) I'obtention d'ARN a partir d'un echantillon biologique dans 
25 une situation physiologique A (rA); 

(b) I'obtention d'ARN a partir d'un meme echantillon biologique 
dans une situation physiologique B (rB); 

(c) la preparation d'ADNc a partir d'une partie des ARN rA 
obtenus en (a) (ADN cA) et a partir d'une partie des ARN rB obtenus en (b) 

30 (ADN cB) au moyen d'amorces polyT, 

(d) I'hybridation en phase liquide d'une partie des ARN rA avec 
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une partie des ADN cB (pour generer des h6teroduplex rA/cB) 

(e) rhybridation en phase liquide d'une partie des ARN rB avec 
une partie des ADN cA (pour generer des heteroduplex rB/cA), 

(f) Tidentification et/ou le clonage de regions d'ARN non 
5 appariees dans les h6teroduplex rA/cB et rB/cA obtenus en (d) et en (e). 

Dans une autre variante particuliere de mise en oeuvre, le 
procede de 1'invention comprend rhybridation d'ARN provenant de la 
situation test avec les ADNc double-brins provenant de la situation de 
reference, et ridentification et/ou le clonage des regions d'ADN double-brin 

10 maintenues. Cette deuxieme variante repose plus particulierement sur la 
formation d'heterotriplex entre les ARN et les ADNc double-brin, derive des 
structures de type R-loop (voir Figure 5). Cette variante est egalement 
preferentiellement mise en oeuvre en utilisant des ARN messagers ou des 
ADNc produits par transcription inverse des ARN messagers 

15 essentiellement, c'est-a-dire en presence d'une amorce polyT. Dans cette 
variante egalement, un mode de realisation particulier comprend deux 
hybridations paralleles, generant deux populations d'acides nucleiques selon 
Pinvention. Dans cette variante, les regions recherchees, specifiques des 
epissages alternatifs, ne sont pas les regions d'ARN non appariees, mais 

20 des ADN double-brins qui n'ont pu etre deplaces par une sequence ARN 
homologue (voir Figure 5). 

Dans une autre variante de I'invention, le procede comprend, 
pour isoler les differences genetiques qualitatives (e.g., les differences 
d'epissage) qui existent entre deux echantillons, rhybridation entre une 

25 population d'ADNc double-brin provenant d'un premier 6chantillon biologique 
et une population d'ADNc (double-brin ou, preferentiellement simple-brin) 
provenant d'un deuxieme echantillon biologique (figure 6). 

A la difference des variantes presentees pr6cedemment, celle-ci 
n'utilise pas des heteroduplexes ou des h6terotriplexes ADN/ARN mais des 

30 homoduplexes ADN/ADN. Cette variante est avantageuse puisqu'elle ne 
donne pas seulement acces aux exons et aux introns alternatifs mais 
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egalement, et a Tinterieur d'une meme banque d'acides nucleiques, aux 
jonctions specifiques creees par deletion d'un exon ou d'un intron. De plus 
les sequences dans une telle banque donnent acces aux sequences 
flanquantes des exons et introns alternatifs. 
5 Pour les deux echantillons (i.e., conditions physiopathologiques) 

etudies, les ARN cytosoliques polyA+ sont extraits selon les techniques 
connues de rhomme de metier et decrites precedemment. Ceux-ci sont 
convertis en ADNc par Taction d'une transcriptase inverse depourvue ou non 
d'activite RNAse H intrinseque, comme decrit precedemment. L'un de ces 
10 ADNc simple brin est ensuite convert! en ADNc double-brin par amorgage a 
I'aide d'hexameres aleatoires et selon les techniques connues de I'homme 
de Tart. Pour Tune des situations etudiees nous disposons done d'un ADNc 
simple-brin (appele "driver") et pour I'autre situation d'un ADNc double-brin 
(appele "tester"). Ces ADNc sont denatures par chauffage puis melanges de 
is telle fa?on que le driver est en exces par rapport au tester. Cet exces est 
choisi entre 1 et 50 fois, avantageusement 10 fois. Dans une experience 
donnee, menee a partir de deux situations physiopathologiques, le choix de 
la situation qui donne le driver est arbitrage et ne doit pas influencer la nature 
des informations recueillies. En effet, comme dans le cas des approches 
precedemment presentees, la strategie d'identification des differences 
qualitatives qui existent entre deux populations d'ARNm repose sur le 
clonage de ces differences presentes dans des messagers communs : la 
strategie repose sur le clonage de sequences presentes au sein de duplex et 
non de simples brins correspondent a des sequences singulteres ou en 
exces dans I'une des situations etudiees. Le melange des populations 
d'ADNc est precipite puis repris dans une solution contenant du formamide 
(par exemple 80%). L'hybridation est men6e de 16 heures £ 48 heures, 
avantageusement 24 heures. Les produits de cette hybridation sont 
precipites puis soumis a Taction d'une endonuclease de restriction ayant un 
site de reconnaissance de TADN double-brin dicte par 4 bases. Une telle 
enzyme de restriction va done diver TADNc double brin form6 lors de 
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I'hybridation en moyenne toutes les 256 bases. Cette enzyme est 
selectionnee avantageusement pour generer des sites cohesifs. Des 
exemples de telles enzymes sont fournis par des enzymes de restriction 
telles Sau3AI, Hpall, Taql et Msel. Sont done accessibles a une strategie de 
5 clonage utilisant les sites de restriction dives les fragments double-brin 
digeres par ces enzymes. Ces fragments sont de deux types : des fragments 
parfaitement hybrides, dont les deux brins sont parfaitement 
complementaires, et des fragments dont Thybridation est partielle e'est a dire 
comprenant une boucle simple brin encadree par des regions double-brin 

10 (Figure 6A). Ces derniers fragments, minoritaires, contiennent les 
informations d'interet. Afin de les separer des fragments parfaitement 
hybrides, majoritaires puisque derives de la majorite de la longueur des 
ADNc, des techniques de separation sur gel ou sur toute autre matrice 
appropriee sont utilisees. Ces techniques mettent a profit le retard de 

15 migration, electrophoretique ou lors de gel filtration notamment, des 
fragments d'ADN qui contiennent une boucle d'ADN simple-brin. Ainsi les 
populations de fragments minoritaires qui contiennent les informations 
desirees peuvent etre separees de fagon preparative des populations de 
fragments majoritaires correspondant aux regions d'ADN identiques dans les 

20 deux populations. Cette variante, qui permet d'isoler au sein d f une meme 
population les empreintes positives et negatives liees a des differences 
qualitatives, peut egalement etre appliquee a des heteroduplexes ARN/ADN. 
A cet egard, un exemple de retard de migration d'un heteroduplexe 
ARN/ADN dans lequel une partie de TARN n'est pas appariee, par rapport a 

25 un heteroduplexe homologue dans lequel toutes les sequences sont 
appariees est illustre sur le modele grb2/grb33 decrit dans les exemples (voir 
notamment la figure 8, puits 2 et 3). 



Identification et/ou Clonage 
30 A partir des populations decides nucteiques generees par 

hybridation, les regions caracteristiques des differences qualitatives (e.g., 
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des epissages. alternatifs differentials) peuvent etre identifies par toute 
technique connue de I'homme du metier 

Identification et/ou clonage a partir des heteroduplexes 

5 ARN/ADN 

Ainsi, dans le cas des heteroduplex ARN/ADN (premiere 
variante du proc6d6), ces regions se presentent essentiellement sous forme 
de regions d'ARN non-appariees (boucles d'ARN), comme represents sur la 
Figure 3. Ces regions peuvent done etre identifies et donees par separation 

10 des heteroduplexes, et des acides nucleiques simple-brin (ADN, ARN) 
(exces d'acide nucleique n'ayant pas reagi), digestion selective des ARN 
double-brins (domaines engages dans les heteroduplex), puis separation des 
ARN simple-brin resultant et des ADN simple-brins. 

A cet egard, seion une premiere approche iilustree sur la Figure 

is 3, les regions d'ARN non appariees sont identifies par traitement des 
heteroduplex au moyen d'une enzyme capable de digerer seiectivement les 
domaines des ARN engages dans des heteroduplex ARN/ADN. Des 
enzymes douees de cette propriete sont decrites dans Tart anterieur et sont 
disponibles dans le commerce. Ce sont les RNases H t telles que en 

20 particulier, celle de E. Coli produite sous forme recombinante et disponible 
dans le commerce (Promega Ref. M4281 ; Life Technologies Ref. 18021). 
Ce premier traitement genere done un melange comprenant les regions 
d'ARN non appariees simple-brin et les ADNc simple-brin. Les ARNs peuvent 
etre separes des ADNc par toute technique connue de I'homme du metier, et 

25 notamment sur ia base du marquage des amorces utilisees pour la 
preparation des ADNc (voir ci-dessus). Ces ARN peuvent etre utilises 
comme source de materiel pour I'identification de cibles, de produits 
genetiques d'interet ou toute autre application. Ces ARN peuvent egalement 
etre convertis en ADNc, puis clones dans des vecteurs, comme decrit ci- 

30 apres. 

A cet §gard, le clonage des ARNs peut etre realises de 
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differentes fa<?ons. L'une consiste a inserer a chaque extremity des ARN des 
oligonucleotides servant de matrice a une reaction de transcription inverse 
en presence des amorces correspondantes. Cet ajout d'amorces se fait 
selon les techniques bien connues de Phomme du metier grace a une 
5 enzyme, telle que par exemple la ARN ligase qui provient du phage T4 et qui 
catalyse la formation de liaisons phosphodiester intermoleculaires entre le 
phosphate en 5' d'une molecule donneuse et Phydroxyl en 3' d'une molecule 
acceptrice. Une telle ARN ligase est disponible commercialement (par 
exemple Life Technologies - GIBCO BRL Ref. 18003). Les ADNc ainsi 

io obtenus peuvent ensuite etre amplifies par les techniques classiques (PCR 
par exemple) en utilisant les amorces appropriees, comme illustre sur la 
Figure 3. Cette technique est particulierement adaptee au clonage des ARN 
de petite taille (inferieure a 1000 b). 

Une autre approche pour le clonage et/ou ('identification des 

15 regions d'ARN specifiques consiste par exemple a realiser une transcription 
inverse, sur le produit de digestion par une enzyme specifique des ARN 
engages dans des double-brins, telle la Rnase H, en utilisant des amorces 
aleatoires, qui vont initier la transcription au hasard a Pinterieur des ARNs. 
Les ADNc obtenus sont ensuite amplifies selon les techniques classiques de 

20 biologie moleculaire, par exemple par PCR en utilisant des amorces grace a 
des oligonucleotides ajoutes aux extremites des ADNc grace a Taction de 
TARN ligase du phage T4 (disponible commercialement ; par exemple chez 
Life Technologies - GIBCO BRL ref. 18003). Cette seconde technique est 
illustree sur la Figure 4 et dans les exemples. Cette technique est plus 

25 particulierement adaptee aux ARNs de taille importante, et permet d'obtenir 
une partie de Pinformation de sequence, suffisante pour reconstituer par la 
suite la totalite de la sequence de depart. 

Une autre approche pour le clonage et /ou Identification des 
regions d'ARN specifiques repose egalement sur la realisation d'une 

30 transcription inverse en utilisant des amorces aleatoires (figure 4). 
Neanmoins, selon cette variante, les amorces utilisees sont au moins en 
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partie des amorces semi-aleatoires, c'est-^-dire des oligonucleotides 
comprenant: 

- une region a!6atoire (de d6g6n£rescence), 

- une zone minimale d'amorgage presentant un degre de 
5 contrainte defini, et 

- une zone stabilisatrice. 

De preference, il s'agit d'oligonucleotides comprenant, dans 
I'orientation 5* ->3' : . 

- une zone stabilisatrice comprenant 8 a 24 nucleotides 
10 determines, de preference de 10 a 18 nucleotides. Cette zone stabilisatrice 

peut elle-meme correspondre a la sequence d'un oligonucleotide utilise pour 
reamplifier les fragments issus des premieres amplifications realisees a Taide 
des amorces semialeatoires de Tinvention. En outre, la zone stabilisatrice 
peut comprendre la sequence d'un ou plusieurs sites, de preference non- 
15 palindromiques, correspondant a des enzymes de restriction. Ceci permet 
par exemple de faciliter le clonage des fragments ainsi amplifies. Un 
exemple particuiier de zone stabilisatrice est represents par la sequence 
GAG AAG CGT TAT (residus 1 a 12 de SEQ ID NO:1); 

- une region aleatoire ayant de 3 a 8 nucleotides, plus 
20 particulierement de 5 a 7 nucleotides, et 

- une zone minimale d'amorgage d6finie de sorte que 
('oligonucleotide s'hybride en moyenne au moins toutes les 60 pb environ, de 
preference toutes les 250 pb environ. Plus preferentiellement, la zone 
d^morgage comporte de 2 a 4 nucleotides definis, preferentiellement 3 ou 4, 

25 tels que par exemple AGGX, ou X represente Tune des quatre bases A, C f G 
ou T. La presence d'une telle zone d'amorgage confere a Toligonucleotide la 
capacite d'hybrider en moyenne toutes les 256 paires de bases environ. 

De maniere particulierement prSferee, il s'agit 
d'oligonucleotides de formule : 

30 GAGAAGCGTTATNNNNNNNAGGX (SEQ ID NO: 1) ou les 

bases fixees ont 6t6 ordonnees de fapon S minimiser le bruit de fond du d 
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des autoappariements dans des experiences de PCR, oil N indique que les 
quatre bases peuvent etre presentes de fa?on aleatoire a la position 
indiqu6e, et ou X represente Tune des bases A, C, G ou T. De tels 
oligonucleotides constituent egalement un objet de la presente invention. 
5 A cet egard, de fa?on a augmenter les possibilites d'amor^age 

sur les ARN a doner, des reactions en parallele peuvent etre effectuees 
avec des oligonucleotides tels que : 

GAGAAGCGTTATNNNNNNNAGGT (oligonucleotides A) 
GAGAAGCGTTATNNNNNNNAGGA (oligonucleotides B) 
10 GAGAAGCGTTATNNNNNNNAGGC (oligonucleotides C) 

G AG AAGCGTTATN N N N N N N AGG G (oligonucleotides D), 
chaque population d'oiigonucleotides (A, B, C, D) pouvant etre utilisee 
individuellement ou en combinaison avec une autre. 

Apres I'etape de transcription inverse, les ADNc sont amplifies 
15 par PCR en utilisant les oligonucleotides A ou B ou C ou D. 

Comme indique ci-avant, selon la complexity et la specificite de 
la population des oligonucleotides souhaitee le nombre de positions 
degSnerees peut varier de 3 a 8, de preference de 5 a 7. En de?a de 3 les 
hybridations sont restreintes et au dela de 8 la population d'oiigonucleotides 
20 est trop complexe pour assurer une bonne amplification de bandes 
specifiques. 

Par ailleurs, la longueur de I'extremite 3' fixe (la zone 
d'amorgage contrainte) de ces oligonucleotides peut egalement etre 
modiftee : si les amorces decrites plus haut, avec 4 bases fixees, permettent 

25 d'amplifier en moyenne des fragments de 256 paires de bases, des amorces 
avec 3 bases fixes permettent d'amplifier des fragments plus courts (64 
paires de bases en moyenne). Dans un premier mode prefer^ de Invention, 
on utilise des oligonucleotides dans lesquels la zone d'amorgage comprend 4 
bases fixes. Dans un autre mode prefere de Tinvention, on utilise des 

30 oligonucleotides ayant une zone d'amorgage de trois bases fixes. En effet, 
les exons ayant une taille moyenne de 137 bases, ceux-ci sont 
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avantageusement amplifies avec de tels oligonucleotides. A cet 6gard, voir 
egalement les oligonucleotides de sequence SEQ ID NO: 2, 3 et 4, par 
exemple. 

Enfin, generalement, Petape d'identification et/ou de clonage 
5 des ARN met en oeuvre les differentes m6thodes de PCR et de clonage, de 
maniere a obtenir rinformation la plus complete. 

. Identification et/ou clonage a partir des heterotriplexes. 

Dans le cas des heterotriplexes (autre variante du procede), les 

10 regions de differences qualitatives (insertions, deletions, epissages 
differentiels) se presentent essentiellement sous forme de regions d'ADN 
double-brin, comme represents sur la Figure 5. Ces regions peuvent done 
etre identifies et donees partraitement en presence d'enzymes appropriees 
telles qu'une enzyme permettant de digerer les ARN, puis une enzyme 

is permettant de digerer les ADN simple-brin. Les acides nucleiques ainsi 
obtenus sont done directement sous forme d'ADN double-brin et peuvent 
etre clones dans tout vecteur approprie, tel le vecteur pMos-Blue 
(Amersham, RPN 5110), par exemple. Cette methodologie est a differencier 
des approches deja decrites utilisant des ARNs ou oligonucleotides ofe 

20 sequences predeterminees, modifies pour exercer une activite nucleasique 
(Landgraf et al. (1994) Biochemistry, 33, 10607-10615). 

. Identification et/ou clonage a partir des homoduplexes 
ADN/ADN (figure 6). 

25 Les fragments isoles par leurs structures atypiques sont ensuite 

additionnes, a chacune de leurs extremites, d'adaptateurs, ou linkers, ayant 
des sites de restriction dives & Tune de leurs extremites. Cette 6tape peut 
etre realisee selon les techniques connues de Thomme du metier, par 
exemple par ligation avec I'ADN ligase du phage T4. Les sites de restriction 

30 ainsi introduits sont choisis compatibles avec les sites des fragments 
d'ADNc. Les linkers introduits sont des sequences d'ADNc double-brin, de 
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sequences connues, permettant de deriver des amorces pour realiser des 
amplifications enzymatiques (PCR). Puisque I'etape suivante consiste a 
amplifier les deux brins qui presentent entre eux les differences qualitatives a 
identifier, il est necessaire d'utiliser des linkers dont les extremites 5' sont 

5 phosphorylees. Ainsi apres denaturation thermique des ADNc double-brin 
additionnes de linkers, chacune des extremites de ces ADNc est liee de 
fagon covalente avec une sequence d'amorgage specifique. Apres PCR a 
I'aide des amorces specifiques appropriees, deux categories d'ADNc double- 
brin sont obtenues: des fragments qui contiennent des sequences 

10 specifiques de differences qualitatives qui distinguent les deux situations 
physiopathologiques, et des fragments qui comprennent I'empreinte negative 
de ces evenements d'epissages. Le clonage de ces fragments permet 
d'obtenir une banque d'epissages alternatifs dans laquelle, pour chaque 
evenement d'epissage, des empreintes positives et negatives sont 

is presentes. Dans cette banque, sont done accessibles non seulement les 
exons et les introns alternatifs mais aussi les jonctions specifiques creees 
par excision de ces sequences epissees. Dans une meme banque, ces 
differentes informations genetiques peuvent provenir des deux situations 
physiopathologiques sans discrimination. Par ailleurs, de fa?on a verifier le 

20 caractere differential des epissages identifies et de fa?on a determiner dans 
quelle situation ceux-ci sont specifiquement recrutes, les clones de la banque 
peuvent etre hybrides avec des sondes derivees de chacune des populations 
totales des ARNm. 

25 Deux usages principaux peuvent etre envisages pour les 

fragments d'ADNc issus des differences qualitatives identifies : 

- Leur clonage dans des vecteurs appropries de fa?on d 
constituer des banques representatives des differences qualitatives qui 
existent entre les deux situations physiopathologiques etudiees, 

30 - Leur utilisation en tant que sondes afin de cribler une banque 

d'ADN permettant d'identifier les evenements episses de fa?on differentielle. 
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Les vecteurs utilises dans I'invention peuvent etre notamment des 
plasmides, cosmides, phages, YAC, HAC, etc. Ces acides nucleiques 
peuvent ainsi etre conserves tels quels ou introduits dans des 
microorganismes adaptes au vecteur de clonage utilise, afin d'etre multiplies 
5 et/ou conserves sous forme de cultures. 

Les m&hodes telles que decrites ci-dessus sont generalement 
mises en oeuvre, pour chaque echantillon, sur une periode de temps de 
moins de deux mois, en particulier moins de 6 semaines. Par ailleurs, ces 
differentes m6thodes peuvent etre automatisees afin de reduire la dur6e 

10 totale et de faciliter le traitement de nombreux echantillons. 

A cet egard, un autre objet de 1'invention concerne les acides 
nucleiques identifies et/ou clones par les methodes de ['invention. Comme 
indique ci-dessus, ces acides nucleiques peuvent etre des ARN ou des 
ADNc. Plus generalement, 1'invention concerne une composition d'acides 

is nucleiques, comprenant essentiellement des acides nucleiques 
correspondant aux epissages alternatifs distinguant deux situations 
physiologiques. Plus particulierement, ces acides nucleiques correspondent 
aux epissages alternatifs identifies dans un echantillon biologique test et non 
presents dans le meme echantillon biologique dans une situation de 

20 reference. L'invention a egalement pour objet I'utilisation des acides 
nucleiques ainsi clones comme produit therapeutique ou diagnostic, ou 
comme outil de criblage de molecules actives, comme indique ci-apres. 

Les differentes methodes expos6es ci-dessus aboutissent done 
toutes au clonage de sequences d'ADNc qui represented [Information 

25 genetique epissee differentiellement entre deux situations 
physiopathologiques. L'ensemble des clones issus de Tune de ces methodes 
permet done la constitution d'une banque representative des differences 
qualitatives qui existent entre deux situations etudiees. 

30 Generation de banques qualitatives 

A cet egard, I'invention concerne en outre un procede de 
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preparation d'une banque d'acides nucleiques representatifs d'un etat 
physiologique donne d'un Echantillon biologique. Ce procede comprend 
avantageusement le clonage d'acides nucleiques representatifs des 
marqueurs qualitatifs depression genetiques (par exemple des epissages 
5 alternatifs) dudit etat physiologique et non presents dans un etat de 
reference, dans des banques specifiques de differences qualitatives qui 
existent entre les 2 etats etudies. 

Ces banques sont constitutes d'ADNc inserts dans des 
vecteurs plasmidiques ou phagiques. Ces banques peuvent etre presentees 

10 sur des filtres de nitrocellulose ou tout autre support connu de I'homme de 
i'art, tels des chips ou biopuces. 

L'une des caracteristiques et en meme temps Tune des 
originates du criblage differentiel qualitatif est que cette technique aboutit a 
non pas une mais avantageusement deux banques differentielles qui 

15 represented Pensemble des differences qualitatives qui existent entre deux 
situations donnees : Paire de banque (voir figure 1D). 

Ainsi, ('invention concerne de preference toute composition ou 
banque d'acides nucleiques, susceptible d'etre obtenue par hybridation entre 
une population d'ARN provenant d'un premier echantillon biologique et une 

20 population d'ADNc provenant d'un deuxieme echantillon biologique. Plus 
preferentiellement, les banques ou compositions de I'invention comprennent 
des acides nucleiques representatifs des differences qualitatives 
d'expression entre deux tchantillons biologiques, et sont produites par un 
procede comprenant (i) une etape au moins d'hybridation entre une 

25 population d'ARN provenant d'un premier echantillon biologique et une 
population d'ADNc provenant d'un deuxieme Echantillon biologique, (ii) ia 
selection des acides nucleiques representatifs des differences qualitatives 
d'expression et, eventuellement (iii) le clonage desdits acides nucleiques. 

En outre, apres constitution de telles banques, il est possible 

30 d'effectuer une etape de selection des clones pour ameliorer la specificite 
des banques obtenues. En effet, il est possible que certains 
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mesappariements observes ne soient pas uniquement dus a differences 
qualitatives (e.g. a des epissages alternatifs differentiels), mais puissent 
resulter de defaut(s) de fa transcription inverse par exemple. Bien que ces 
evenements ne soient pas generalement significatifs, il est preferable de les 
5 eiiminer ou de les reduire prealablement au clonage des acides nucleiques. 
Pour ce faire, les clones de la banque peuvent etre hybrides avec les 
populations d'ADNc des deux situations physiologiques Studiees (voir etape 
(c) ci-dessus). Les clones hybridant de fagon non differentielle avec les deux 
populations peuvent etre consideres comme non-specifiques et 

10 eventuellement elimines ou traites en deuxieme priorite (en effet, I'apparition 
d'une nouvelle isoforme dans I'echantillon test ne signifie pas toujours que 
risoforme initiale presente dans I'echantillon de reference a disparu de cet 
echantillon test). Les clones n'hybridant qu'avec une seule des deux 
populations ou hybridant de fa?on preferentielle avec Tune des populations 

15 sont consideres comme specifiques et peuvent etre selectionnes en premiere 
priorite pour constituer des banques enrichies ou affinees. 

Un affinage peut egalement etre realise par hybridation et 
validation de clones avec des sondes provenant d'un nombre statistiquement 
relevant d'echantillons pathologiques. 

20 La presente demande a done egalement pour objet toute 

banque d'acides nucleiques comprenant des acides nucleiques specifiques 
d'epissages alternatifs caracteristiques d*une situation physiologique. Ces 
banques sont avantageusement constitutes d'ADNc, generalement double 
brin, correspondant aux regions d'ARN specifiques d f un epissage alternatif. 

25 Ces banques peuvent etre constitutes des acides nucleiques, generalement 
dans un vecteur de clonage ou de cultures cellulaires contenant lesdits 
acides nucleiques. 

Le choix des ARN de depart determine en partie les 
caracteristiques des banques obtenues : 

30 - les ARN des deux situations A et B sont des ARNm ou des 

ARN totaux matures isoles selon les techniques connues de Phomme de Tart 
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Les banques sont alors des banques de criblage differential qualitatif dites 
restreintes, car restreintes aux differences qualitatives qui caracterisent les 
ARN matures des deux situations physiopathologiques. 

- Les ARN de Tune des situations sont des ARNm ou totaux 
5' matures alors que les ARN de I'autre situation sont des ARN premessagers, 
non matures par epissage, isoles selon les techniques connues de Thomme 
de Tart, a partir de noyaux cellulaires. Dans ce cas les banques obtenues 
sont des banques de criblage differential dites complexes, puisque non 
restreintes aux differences entre ARN matures mais comprenant tout le 
10 repertoire des epissages transcrits dans une situation et elimines dans 
I'autre, dont tous les introns. 

enfin, les ARN peuvent provenir d'une seule situation 
physiopathologique et dans ce cas le criblage differentiel implique les ARN 
matures et les premessagers d'un meme echantillon. Dans ce cas, les 
15 banques obtenues sont des banques de criblage differentiel qualitatif 
autologues. L'interet de telles banques est qu'elles rassemblent 
exclusivement le repertoire des introns transcrits dans une situation donn6e. 
Leur hybridation avec une sonde provenant d'ARN matures d'une autre 
situation determine rapidement si a cette situation est caracterisee par une 
20 retention d'introns tout en permettant aisement leur identification. 

Generalement, les banques sont generees par etalement, sur 
milieu solide (notamment sur milieu gelose), d'une culture cellulaire 
transformee par les acides nucleiques clones. La transformation est realis§e 
par toute technique connue de i'homme du metier (transfection, phosphate 
de calcium, electroporation, infection par des bacteriophages, etc). La culture 
cellulaire est generalement une culture de bacteries, telles que par exemple 
les bacteries E. coli. II peut egalement s'agir de cultures de cellules 
eucaryotes, notamment de cellules eucaryotes inferieures (levures par 
exemple). Cet etalement peut etre realise sur boite ou sur tout autre support 
adapte, en conditions steriles. En outre, ces cultures etalees en milieu gelose 
peuvent etre stockees sous forme congelee par exemple (dans du glycerol 
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ou autre agent adapte). Ces banques peuvent naturellement etre utilisees 
pour la production de "repliques", c'est-a-dire de copies selon les techniques 
habituelles detaillees ci-apres. En outre, ces banques servent generalement 
a preparer une banque amplifiee, c'est-a-dire une banque comprenant 
5 chaque clone sous forme amplifiee. Une banque amplifiee est preparee 
comme suit : a partir de la culture etalee, tous les clones cellulaires sont 
recuperes et sont conditionnes pour etre conserves sous forme congelee ou 
au froid, dans tout milieu adapte. Cette banque amplifiee est 
avantageusement realisee a partir de cultures de bacteries E.coli, et 

10 conservee a 4°C, en conditions steriles. Cette banque amplifiee permet la 
preparation et la reproduction illimitee de toute banque ulterieure contenant 
ces clones, sur differents supports, pour differentes applications. Une telle 
banque permet en outre I'isolement et la caracterisation de tout clone 
d'interet. Chacun des clones constituant les banques de I'invention est en 

is effet un 6l6ment caracteristique d'une situation physiologique, et constitue 
done une cible particulierement interessante pour differentes etudes telles 
que la recherche de marqueurs, la preparation d'anticorps, le diagnostic, le 
traitement pour transfert de genes, etc. Ces differentes applications sont 
discutees plus en detail plus loin. La banque est generalement preparee 

20 comme decrit ci-dessus par etalement des cultures dans un milieu g6lose, 
sur un support adapte (boite de petri par exemple). Uinteret d'utiliser un 
milieu gelose est que chaque colonie peut etre separee et individualisee. A 
partir de cette culture, des repliques a I'identique peuvent etre preparees en 
quantites importantes par simple "replique" sur tout support approprie selon 

25 les techniques de Thomme de Tart. Ainsi, la replique peut etre realisee au 
moyen de filtres, membranes (nylon, nitrocellulose, etc) permettant 
Taccrochage des cultures. Les filtres peuvent ensuite etre stockes en T6tat, a 
4°C par exemple, sous forme dessechee, dans tout type de conditionnement 
qui n'altere pas les acides nucleiques. Les filtres peuvent egalement etre 

30 traites de maniere a eliminer les cellules, proteines, etc, et a ne conserver 
que des composants tels que les acides nucleiques. Ces traitement peuvent 
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comprendre notamment des proteases, des detergents, etc. Les filtres trails 
peuvent egalement etre conserves . dans tout dispositif ou toute condition 
adaptes aux acides nucleiques. 

Les banques d r acides nucleiques peuvent egalement etre 
5 pr6parees directement a partir des acides nucleiques, par depot sur des 
biopuces ou tout autre dispositif approprie. 

^invention concerne egalement toute banque comprenant des 
oligonucleotides specifiques d'6pissages alternatifs distinguant deux 
situations physiologiques. II s'agit avantageusement d'oligonucleotides 
10 simple-brin, comprenant de 5 a 100-meres, de preference moins de 50- 
meres, par exemple autour de 25-meres environ. 

Ces oligonucleotides sont specifiques d'epissages alternatifs 
representatifs d'une situation ou d'un type de situation physiologique. Ainsi, 
de tels oligonucleotides peuvent etre par exemple des oligonucleotides 
15 representatifs d f ev6nements d'epissages alternatifs caracteristiques de 
situations d'apoptose. II a en effet ete decrit dans la litterature que certains 
epissages alternatifs etaient observes dans le cadre de situations 
apoptotiques. II s'agit par exemple d'epissages dans les genes Bclx, Bax, 
Fas ou Grb2 notamment. A partir des donnees publiees et des sequences 
20 accessibles dans la litterature et/ou sur bases de donnees, il est possible de 
creer des oligonucleotides specifiques des formes epissees et non epissees. 
Ces oligonucleotides peuvent par exemple etre crees selon la strategie 
suivante : 

(a) identification d f une proteine ou d'un evenement d'epissage 
25 caracteristique d'une situation d'apoptose et de la sequence du domaine 

episse. Cette identification peut etre basee sur des donnees publiees ou par 
compilation de sequences accessibles sur bases de donnees; 

(b) synthese artificielle d f un ou plusieurs oligonucleotides 
correspondant a une ou plusieurs regions de ce domaine, qui permettent 

30 done par hybridation de mettre en evidence la forme non epissee dans les 
ARN d'un 6chantillon test; 
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(c) synthese artificielle d'un ou plusieurs oligonucleotides 
correspondant a la region de jonction entre les deux domaines separes par 
le domaine 6pisse. Ces oligonucleotides permettent done par hybridation de 
mettre en evidence la forme epissee dans les ARN d'un echantillon test; 
5 (d) reproduction des etapes (a) a (c) ci-dessus avec d'autres 

proteines ou evenements d'epissages caracteristiques d'une situation 
d'apoptose; 

(e) transfert sur un premier support approprie du ou des 
oligonucleotides specifiques des formes apoptotiques des messagers 

10 identifies ci-avant et, sur un autre support approprie, du ou des 
oligonucleotides specifiques des formes non-apoptotiques. 

Les deux supports ainsi obtenus peuvent etre utilises pour 
tester I'etat physiologique de cellules ou echantillons tests, et notamment leur 
etat apoptotique, par hybridation d'une preparation d'acides nucleiques de 

15 ces cellules ou echantillons. 

D'autres banques similaires peuvent etre generees avec des 
oligonucleotides specifiques d'etats physiopathologiques differents 
(neurodegenerescence, toxicite, proliferation, etc.) et ainsi permettre un 
elargissement des domaines d'applications. 

20 Des banques dlntrons ou d'exons alternatifs peuvent aussi etre 

des banques de donnees informatiques constitutes par analyse 
systematique des banques de donnees qui regroupent les informations 
relatives au genome de tel ou tel organisme, tissu ou culture cellulaire. Dans 
ce cas, les donnees obtenues par constitution de telles banques virtuelles 

25 peuvent etre utilisees pour g6nerer des amorces oligonucleotidiques qui 
seront utilisees pour tester en parallele deux situations physiopathologiques. 

Les donnees des banques informatiques peuvent egalement 
etre utilisees pour deriver des sondes nucleotidiques generates, 
representatives d'une classe de proteines ou encore specifiques d'une 

30 sequence definie. Ces sondes peuvent ensuite etre appliquees sur les 
banques de clones issues des differentes techniques de clonage des introns 
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et exons alternatifs afin d'obtenir une image de la complexity de ces banques 
moleculaires et de determiner rapidement si telle ou telle classe de proteines 
ou telle ou telle sequence determinee est epissee differentiellement entre 
deux etats physiopathologiques distincts. 
5 Une autre banque ou compositions d'acides nucleiques selon 

I'invention est une banque antisens, realisee a partir des sequences 
identifies selon les methodes de Pinvention (DATAS). Pour la realisation de 
ce type de banques, ces sequences sont donees de fa?on & etre exprimees 
en fragments d'ARN correspondant a une orientation antisens par rapport 

10 aux ARN messagers sur lesquels ont ete realises DATAS. On aboutit ainsi a 
une banque dite antisens. Cette approche utilise de preference la variante de 
clonage qui permet une orientation des fragments clones. Uinteret d'une telle 
banque antisens est de permettre la transfection de lignees cellulaires et de 
suivre Alteration de tout phenotype qu'il soit d'ordre morphologique, 

15 enzymatique ou suivi par I'utilisation de genes rapporteurs ou de resistance a 
un agent de selection. L'analyse des variations ph£notypiques consecutives 
a Tintroduction d'un vecteur d'expression antisens se fait generalement apres 
selection de clones dits stables, c'est a dire permettant une replication 
coordonnee du vecteur d'expression et du genome de I'hote. Cette 

20 coordination est permise par I'integration du vecteur d'expression dans le 
genome cellulaire ou, lorsque le vecteur d'expression est episomal, par 
pression de selection. Cette pression de selection se fait par traitement de la 
culture cellulaire transferee avec un agent toxique qui ne peut etre detoxifie 
que lorsque le produit d'un gene porte par le vecteur d'expression est 

25 exprime dans la cellule. II s'ensuit une synchronisation entre la replication de 
Thote et celle du transgene. Avantageusement, on utilise des vecteurs 
episomaux derives du virus Epstein-Barr qui permettent I'expression dans 
une meme cellule de 50 a 100 copies du vecteur (Deiss et al, 1996, EMBO 
J., 15, 3861-3870 ; Kissil et al, 1995, J. Biol. Chem, 270, 27932-27936). 

30 L'interet de ces banques antisens alliees aux sequences 

DATAS qu'elles contiennent est d'identifier non seulement quel gene a eu 
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son expression inhib6e pour amener au phenotype s6!ectionn6 mais aussi 
d'identifier quelle isoforme d'epissage de ce gene a ete affectee. Lorsque le 
fragment antisens cible un exon donn6, il peut en etre deduit que le domaine 
proteique et done la fonction impliquant ce domaine s'oppose au phenotype 
5 observe. En cela le couplage de DATAS avec une approche antisens 
represente un raccourci vers la genomique fonctionnelle. 

Puces a ADN 

L'invention concerne egalement tout support (membrane, filtre, 

10 biopuce, chip, etc) comprenant une banque ou une composition d'acides 
nucleiques telle que definie ci-dessus. II peut s'agir plus particulierement 
d'une banque cellulaire ou d'une banque d'acides nucleiques. L'invention 
concerne egalement tout kit ou support comprenant plusieurs banques selon 
Tinvention. En particulier, il peut etre avantageux d'utiliser en parallele une 

15 banque representative des qualites d'un etat physiologique test par rapport a 
un 6tat physiologique de reference et, a titre de contr6le, une banque 
representative des qualites de Tetat physiologique de reference par rapport a 
r§tat physiologique test ("paire de banques"). Un kit avantageux selon 
Tinvention comprend done deux banques qualitatives differentielles de deux 

20 situations physiologiques (une "paire de banques"). Selon un mode de 
realisation particulier, les kits de Tinvention comprennent plusieurs paires de 
banques telles que definies ci-dessus, correspondant a differents etats 
physiologiques ou a differents echantillons biologiques par exemple. Les kits 
peuvent comprendre par exemple ces differentes paires de banques 

25 deposees en serie sur un meme support. 

Generation de sondes 

Une autre utilisation des compositions d'ADNc selon Tinvention, 
representatifs des differences qualitatives qui existent entre deux 6tats 
30 physiopathologiques, consiste a en deliver des sondes. De telles sondes 
peuvent en effet etre utilisees pour cribler les tenements episses de fagon 
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differentielle entre deux situations physiopathologiques. 

Ces sondes (voir figure 1D) peuvent etre preparees par marquage des 
populations ou banques d'acides nucleiques selon les techniques 
classiques, connues de I'homme du metier. Ainsi, il peut s'agir de marquage 
5 ' enzymatique, radioactif, fluorescent, immunologique, etc. Preferentiellement, 
il s'agit d'un marquage radioactif ou fluorescent. Ce type de marquage peut 
etre realise par exemple en introduisant sur la population d'acides 
nucleiques (soit apres synthese soit au cours de leur synthese) des 
nucleotides marques, permettant leur revelation par les methodes 

10 conventionnelles. 

Une application est done de cribler une banque genomique 
classique. Une telle banque peut comprendre selon le vecteur, derive d'un 
phage ou d'un cosmide, des fragments d'ADN de 10kb a 40kb. Le nombre 
de clones hybridant avec les sondes gen6rees par DATAS et representatifs 

15 des differences d'epissage qui existent entre deux situations reflete done a 
peu pres le nombre de genes affectes par des variations d'epissage, selon 
qu'ils sont exprimes dans Tune ou I'autre des situations etudiees. 

De preference, les sondes de I'invention sont utilisees pour 
cribler une banque d'ADN genomique (generalement humaine) adaptee a 

20 I'identification d'evenements d'epissage. De preference, une telle banque 
genomique est composee de fragments d'ADN de taille restreinte 
(generalement clones dans des vecteurs), de fagon a statistiquement ne 
recouvrir qu'un seul element epissable diff6rentiellement, e'est a dire un seul 
exon ou un seul intron. La banque d'ADN genomique est done preparee par 

25 digestion d'ADN genomique avec une enzyme ayant un site de 
reconnaissance restreint par 4 bases, assurant ainsi la possibilite d'obtenir 
par digestion menagee des fragments d'ADN de taille moyenne de 1kb. De 
tels fragments necessitent I'obtention de 10 7 clones pour constituer une 
banque d'ADN representative d'un genome d'organisme eucaryote 

30 superieur. Une telle banque constitue egalement un objet de la pr6sente 
demande. Cette banque est ensuite hybridee avec les sondes deriv§es du 
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criblage differentiel qualitatif. Precisement, de chaque experimentation 
consideree et qui compare deux situations physiopathologiques A et B, deux 
sondes (paire de sondes) sont obtenues. line sonde enrichie en 
evenements d'epissages caracteristiques de la situation A et une sonde 

5 enrichie en marqueurs d'6pissage de B. Les clones de la banque g6nomique 
qui hybrident preferentiellement avec Tune ou I'autre sonde portent des 
sequences preferentiellement epissees dans les situations 
physiopathologiques correspondantes. 

Les methodes de Pinvention permettent ainsi I'identification 

10 systematique de differences qualitatives d'expression genique. Ces 
methodes presentent de nombreuses applications, dans Identification et/ou 
le clonage de molecules d'interet, en toxicoiogie, en pharmacologie ou 
encore en pharmacogenomique par exemple. 

15 Applications 

^invention concerne done egalement Putilisation des methodes, 
acides nucleiques ou banques decrite ci-dessus pour ('identification de 
molecules d'interet therapeutique ou diagnostique. Uinvention concerne plus 
particulierement Tutilisation des methodes, acides nucleiques ou banques 
decrite ci-dessus pour Identification de proteines ou domaines proteiques 
affectes dans une pathologie. 

Uun des atouts de ces techniques est en effet dldentifier a 
Tinterieur d f un messager, et par consequent de la proline correspondante, 
les domaines fonctionnels qui sont affectes dans une pathologie donnee. 
Cela permet designer a un domaine donne une importance dans le 
developpement ou le maintien d'un etat pathologique. L'avantage imm6diat 
de restreindre a un domaine precis d'une proteine Timpact d'une deregulation 
pathologique est de proposer celui-ci comme une cible relevante pour un 
criblage de petites molecules a visee therapeutique. Ces^ informations 
constituent egalement des clefs qui permettent de concevoir des 
polypeptides a activity therapeutique delivrables par therapie genique; Ces 
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polypeptides peuvent notamment etre des anticorps simples chaTnes derives 
d'anticorps neutralisants diriges contre les domaines identifies par les 
techniques d6crites ci avant. 

Plus specifiquement, les methodes selon ('invention permettent 
5 d'obtenir des molecules qui peuvent: 

- etre des sequences codantes qui derivent d'exons alternates. 

- corresponds a des sequences non codantes portees par des 
introns episses differentiellernent d'un etat physiopathologique a un autre. 

De ces deux points, differents enseignements peuvent etre 

10 tires. 

Les epissages alternatifs d'exons qui differencient deux etats 
physiopathologiques traduisent un niveau de regulation de I'expression 
genetique qui permet de moduler ( plus precisement d'abolir ou d'instaurer) 
une ou plusieurs fonctions d'une proteine donnee. Ainsi la plupart des 
15 domaines structuraux et fonctionnels (SH2, SH3, PTB, PDZ, et les domaines 
catalytiques de differentes enzymes...) etant codes par plusieurs exons 
contigus, deux configurations peuvent se presenter : 

i) Les domaines sont tronques dans la situation 
pathologique (Zhu, Q. et al, 1994, J. Exp. Med., vol 180, n°2, pp461-470); 

20 cela indique que les chemins de signalisation impliquant ces domaines 
doivent etre restaures dans un but therapeutique. 

ii) Les domaines sont maintenus au cours d'une 
pathologie alors qu'ils sont absents dans une situation saine; ces domaines 
peuvent etre consideres comme des cibles de criblage de petites molecules 

25 chimiques destinees a antagoniser les signaux transduits par I'interm^diaire 

de ces domaines. 

Les sequences epissees differentiellernent peuvent 

corresponds a des regions non-codantes situees en 5' ou en 3' de la 

sequence codante ou a des introns intervenant entre deux exons codants. 
30 Dans les regions non codantes, ces epissages differentiels peuvent traduire 

une modification de la stability ou de la traductibilite du messager (Bloom, T. 



WO 99/46403 



36 



PCT/FR99/00547 



J., and Beavo, J. A., 1995, Proc. NatL Acad. Sci. USA, vol93, n° 24, pp 
14188-14192; Ambartsumian, N. et aL, 1995, Gene, vol 159, n° 1, pp 125- 
130). Ces phenomenes doivent alors etre recherches sur la base de ces 
informations et peuvent mettre en evidence que Paccumulation ou la 
5 disparition de la proteine correspondante la designe ainsi comme cible 
d'interet. Lorsque la retention d'un intron se produit dans une sequence 
codante, il s'ensuit le plus souvent une troncature de la proteine naturelle par 
introduction de codon stop dans la phase de lecture (Varesco, L, et al, 1994, 
Hum. Genet., vol 93, n°3, pp281-286; Canton, H., et al., 1996, Mol. 

io Pharmacol., vol 50, n° 4, pp799-807, Ion, A., et al, 1996, Am. J. Hum. 
Genet, vol 58, n°6, pp1 185-1 191). Avant de rencontrer ce codon stop, il se 
produit generalement une lecture de quelques codons supplementaires, ce 
qui aboutit a adjoindre a la partie deja traduite une sequence specifique, 
temoin proteique de I'epissage alternatif. Ces acides amines 

is supplementaires peuvent §tre utilises pour generer des anticorps specifiques 
de la forme alternative caracteristique de la situation pathologique. Ces 
anticorps peuvent etre ensuite utilises comme outils de diagnostic. La 
proteine tronquee voit ses proprietes modifiees, voire alterees. Ainsi des 
enzymes peuvent etre amputees de leur domaine catalytique ou de leur 

20 domaine regulateur, devenant inactives ou constitutivement activees. Des 
adaptateurs peuvent perdre leur capacite a connecter differents partenaires 
d 'une cascade de signalisation(Watanabe, K. et al, 1995, J. Biol. Chem., vol 
270, n°23, pp1 3733-1 3739). Les produits d'epissage des recepteurs peuvent 
aboutir a des recepteurs qui ont perdu leur capacite a Her leur ligand 

25 (Nakajima, T. et al, 1996, Life Sci., vol58, n°9, pp761-768) et peuvent 
egalement generer des formes de recepteurs solubles par relargage de leur 
domaine extracellulaire (Cheng J., 1994, Science, vol263, n° 5154, pp1759- 
1762). Dans ce cas, des tests diagnostiques peuvent etre envisages, bases 
sur la circulation dans les differents fluides physiologiques de forme soluble 

30 de recepteur a un ligand donne. 

Uinvention concerne plus particulterement Putilisation des 
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m&hodes, acides nucleiques ou banques decrits ci-dessus pour 
Tidentification de domaines antigeniques specifiques de proteines impliquees 
dans une pathologie. ^invention conceme egalement 1'utilisation des acides 
nucteiques, proteines ou peptides tels que decrits ci-avant pour le diagnostic 
5 de pathologies. 

^invention conceme Egalement une methode d'identification 
et/ou de production de proteines ou domaines proteiques impliques dans une 
pathologie comprenant ; 

(a) ('hybridation des ARN messagers d'un echantillon 
10 pathologique avec les ADNc d'un echantillon sain, ou I'inverse, ou ies deux 

en parallele, 

(b) Tidentification, dans les hybrides formes, des regions 
correspondant aux differences qualitatives (non appariees (ARN) ou 
appariees (ADN double brin)), specifiques de Tetat pathologique par rapport 

is 3 I'etat sain, 

(c) Tidentification et/ou la production de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifiees en (b). 

Les regions identifiees correspondent generalement a des 
epissages differentiels, mais il peut egalement s'agir d'autres alterations 
20 genetiques telles que insertion(s) ou d6letion(s), par exemple. 

La ou les proteines ou domaines proteiques peuvent etre isoles, 
sequences, et utilises dans des applications therapeutiques ou 
diagnostiques, notamment pour la preparation d^nticorps. 

A titre d'exempie plus specifique, le criblage differentiel qualitatif 
25 de Tinvention permet avantageusement de mettre en Evidence des genes 
suppresseurs de tumeurs. En effet, de nombreux exemples indiquent que 
Tun des modes deactivation des g6nes suppresseurs au cours de la 
progression tumorale est une inactivation par modulation de !'6pissage de 
formes alternatives. 

30 Ainsi, dans les carcinomes pulmonaires a petites cellules, le 

gene de la proteine p130 qui appartient a la famille RB (proteine du 
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retinoblastoma) est mute a un site consensus d'6pissage. La consequence 
de cette mutation est ('elimination de Texon 2 et une non synthese de 
proteine due a la presence d'un codon stop precoce. Cette observation a 6te 
la premiere a souligner I'importance des membres de la famille RB dans la 
5 tumorig6n£se. De meme, dans certains cancers du poumon non & petites 
cellules, le gene de la proteine p16INK4A, proteine qui est un inhibiteur des 
kinases cyclines-dependantes cdk4 et cdk6 est mute dans un site donneur 
d'epissage. Le resultat de cette mutation est la production d'une proteine 
tronquee a demi-vie courte ce qui a pour consequence Paccumulation des 

10 formes phosphorylees, inactives, de RB. Par ailleurs, WT1, le gene 
suppresseur de tumeur de Wilms, est transcrit en plusieurs ARN messagers 
generes par epissages alternatifs. Dans les cancers du sein, les proportions 
relatives des differents variants sont modifiees par rapport au tissu sain, 
fournissant des outils diagnostics et des pistes pour comprendre rimportance 

is des differents domaines fonctionnels de WT1 dans la progression tumorale. 
Ce meme phenomene de modification des rapports entre differentes formes 
d'ARN messagers et d'isoformes proteiques lors de la transformation 
cellulaire est retrouve pour la neurofibrine NF1. En outre, cette notion de 
modulation des ph6nomenes d'epissage qui signe la progression tumorale 

20 est soutenue egalement par I'exemple de HDM2 dont 5 epissages alternatifs 
sont detectes dans les carcinomes ovariens et pancreatiques et dont les 
expressions augmentent selon le stade d'avancement tumoral. D'autre part, 
dans les cancers de la tete et du cou, I'un des mecanismes deactivation de 
p53 implique une mutation dans un site consensus d'6pissage. 

25 Ces quelques exemples listes illustrent tout Tinteret des 

techniques de ('invention basees sur la recherche systematique des 
variations d'epissage qui distinguent une tumeur donnee du tissu sain voisin. 
Les resultats qui en decoulent permettent en effet non seulement la 
caracterisation de genes suppresseurs de tumeurs deja connus mais 

30 egalement, compte tenu de I'aspect original et systematique des techniques 
de criblage differential qualitatif, ['identification de nouvelles variations 



WO 99/46403 



39 



PCT/FR99/00547 



d'epissages specifiques de tumeurs affectant vraisemblablement de 
nouveaux genes suppresseurs de tumeurs. 

Uinvention a done egalement pour objet un proc6de 
d'identification et/ou de clonage de genes suppresseurs de tumeurs ou 
5' d'alterations g6netiques (e.g., d'epissages) au sein de genes suppresseurs 
de tumeurs, tel que d6fini ci-avant. Ce procede peut avantageusement 
comprendre les etapes suivantes : 

(a) Thybridation des ARN messagers d'un 6chantillon de tumeur 
avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux en paraltele, 
10 (b) (Identification, dans les hybrides formes, des regions 

specifiques de Techantillon tumoral par rapport a I'etat sain, 

(c) ('identification et/ou le clonage de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifies en (b). 

Les proprietes suppresseur de tumeur des proteines ou 
is domaines identifies peuvent ensuite etre testees dans differents modeles 
connus. Ces prolines, ou leur forme native (possedant P6pissage obsen/6 
dans le tissu sain), peuvent ensuite etre utilisees dans des applications 
therapeutiques ou diagnostiques, notamment en therapie genique 
antitumorale. 

20 La presente demande a done Egalement pour objet non 

seulement les differents aspects de mise en oeuvre de la technologie mais 
aussi I'exploitation des informations qui en decoulent a des fins de 
recherche, de developpement de criblage de petites molecules chimiques, de 
developpement d'outils de therapie genique ou de diagnostic. 

A ce titre, Tinvention concerne egalement Tutilisation des 
methodes, acides nucleiques ou banques decrits ci-dessus en 
genotoxicologie, c f est-a-dire pour anticiper (predire) le potentiel toxique de 
composes tests. 

Les programmes g6netiques engages lors du traitement de 
cellules ou de tissus par des agents toxiques sont en grande partie correles 
aux phenomenes d'apoptose ou mort cellulaire programmee. ^importance 



WO 99/46403 PCT/FR99/00547 

40 

des phenomenes d'epissage alternatif dans la regulation de ces voies 
apoptotiques est bien illustr§e par la literature. Cependant, aucune 
technologie genomique dScrite jusqu'S present ne permettait de rechercher 
systematiquement et d'isoler de maniere exhaustive les variations de 
5 sequences dues a des epissages altematifs et distinguant deux situations 
physiopathologiques donnees. Les techniques de criblage drfferentiel 
qualitatif d6veloppees dans la pr6sente invention permettent de regrouper 
I'ensemble des differences d'6pissage qui existent entre deux situations dans 
des banques d'ADNc. La comparaison des sequences d'ARN (par exemple 

10 les ARN messagers) d'un tissu (ou d'une culture cellulaire) traite ou non avec 
un compose toxique de reference permet d'etablir des banques d'ADNc qui 
regroupent les differences qualitatives de I'expression genique qui 
caracterisent Taction toxique etudiee. Ces banques d'ADNc peuvent ensuite 
etre hydridees avec des sondes derivees d'ARN extrait des memes tissus ou 

is cellules traifes avec un produit chimique dont on veut evaluer le potentiel 
toxique. La plus ou moins grande capacite de ces sondes a s'hybrider avec 
les informations gen6tiques specifiques d'une situation toxique de reference 
permet de lui assigner un potentiel toxique. Par ailleurs, outre I'application de 
DATAS a la generation et Tutilisation de banques de differences qualitatives 

20 induites par des agents toxiques, une partie de invention consiste 
egalement a demontrer que des deregulations dans l'6pissage de certains 
ARNs messagers peuvent etre induites par certains agents toxiques, a des 
doses inferieures aux IC50 mesurees dans des tests de cytotoxicite et 
d'apoptose connus de Thomme de I'art. De telles deregulations (ou 

25 dysregulations) peuvent etre utilisees comme marqueurs pour le suivi de la 
toxicity et/ou de Tefficacite de molecules (chimiques ou gen6tiques). 

L'invention concerne done egalement toute methode de 
detection ou de suivi du potentiel toxique et/ou th6rapeutique d ! un compose 
basee sur la detection de formes et/ou de profils d'epissages induits par ce 

30 compose sur un 6chantillon biologique. Elle concerne en outre ('utilisation de 
toute modification de formes et/ou de profils d'epissages comme marqueur 
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pour le suivi de la toxicite et/ou de I'efficacite de molecules. 

devaluation ou le suivi. du potentiel toxique peut s'effectuer plus 
particuiierement selon deux approches : 

Selon la premiere approche, le criblage differentiel qualitatif 
5 peut etre realise entre un tissu ou une culture cellulaire de reference, d'une 
part non traite et d'autre part traite par le produit dont on veut evaluer la 
toxicite. Uanalyse des clones qui represented les differences qualitatives 
specifiquement induites par le produit permet ensuite eventuellement de 
detecter dans ces clones des evenements caracteristtques d'ADNc impliques 
10 dans les phenomenes lies a la toxicite comme I'apoptose. 

L'apparition de ces marqueurs est suivie selon la dose et la 
duree du traitement par le produit et permet une approche de son profil 
toxicologique. 

La presente demande a done egalement pour objet un procede 
is d'identification, par criblage differentiel qualitatif selon les techniques 
presentees ci-dessus, de marqueurs de toxicite induits dans un systeme 
biologique modele par un compose chimique dont on veut tester le potentiel 
toxique. A cet egard, 1'invention conceme notamment un procede 
d'identification et/ou de clonage decides nucteiques sp6cifiques d'un etat 
20 toxique d'un echantillon biologique donne comprenant la preparation de 
banques differentielles qualitatives entre les ADNc et les ARN de Techantillon 
apres ou sans traitement par un compost toxique test, et la recherche de 
marqueurs de toxicite specifiques des qualites de r§chantillon apres 
traitement. 

25 Selon la deuxieme approche, des abaques pour differentes 

classes de produits toxiques rassemblent leur profil de toxicite selon les 
doses employees et selon les durees des traitements pour un tissu ou un 
modele cellulaire de reference. A chaque point de ces abaques, des 
banques d'ADNc caracteristiques des differences gen6tiques qualitatives 

30 peuvent etre etablies. Ces banques sont des banques differentielles 
qualitatives, i.e., elles sont obtenues par extraction des informations 
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genetiques du. point choisi dans les abaques et du point correspondant au 
modele tissulaire ou cellulaire controle. Comme cela est illustre dans les 
exemples, le criblage differentiel qualitatif repose sur Phybridation d'ARNm 
extraits d'une situation avec les ADNc issues d'une autre. Comme indique 
5 plus haut, le criblage differentiel qualitatif peut etre egalement mene a partir 
d'ARN totaux ou d'ARN nucleates contenant les premessagers. 

A cet egard, Pinvention concerne un procede de determination 
ou devaluation de la toxicite d'un compose test sur un echantillon biologique 
donne comprenant ['hybridation : 
10 - de banques differentielles entre les ADNc et les ARN dudit 

echantillon biologique a Petat sain et a un ou differents stades de toxicite 
resultant d'un traitement dudit echantillon avec un compose toxique de 
reference, avec, 

- une preparation d'acides nucleiques de P6chantillon biologique 
is traite par ledit compose test, et 

- revaluation du potentiel toxique du compose test par analyse 
du degre d'hybridation avec les differentes banques. 

Selon ce procede, pour chaque situation (doses de compose et/ou 
temps dlncubation), deux hybridations reciproques sont avantageusement 
20 realisees, entre : 

- les ARN de la situation A (test) et les ADNc de la 
situation B (reference) ( rA/cB) 

- les ARN de la situation B (reference) et les ADNc de la 
situation A (test) (rB/cA). 

25 A chaque situation toxique de reference, £ chaque point des 

abaques, correspondent done deux banques de criblage differentiel qualitatif. 
L'une de ces banques regroupe les variations qualitatives, e'est a dire 
notamment les epissages altematifs, specifiques de la situation normale de 
reference alors que Pautre banque rassemble les epissages specifiques des 

30 evenements toxiques. Ces banques sont repliquees sur des supports solides 
tels des filtres de nylon ou de nitrocellulose ou avantageusement sur des 
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chips. Ces banques formees initialement par des fragments cTADNc de 
longueur variable (selon les ev6nements d'epissages concernes) peuvent 
etre optimisees par I'emploi d'oligonucleotides derives des sequences isolees 
initialement. 

5 Lorsqu'un compose chimique est propose pour un 

developpement pharmaceutique, il peut etre applique sur les memes 
modeles tissulaires ou cellulaires que ceux repertories dans les abaques de 
toxicite. Des sondes moleculaires peuvent ensuite etre realisees a partir 
d'ARNm extraits des echantillons biologiques traites par le compose 

10 chimique d'interet. Ces sondes sont ensuite hybrid§es a des filtres portant 
I'ADNc des banques rA/cB et rB/cA. Par exemple, la banque rA/cB peut 
contenir les sequences specifiquement presentes dans la situation normale 
et la banque rB/cA les elements d'epissage alternatifs specifiques de la 
situation de toxicite. L'innocuite ou la toxicite du compose chimique est alors 

is aisement evaluee en fonction des profils d'hybridation d'une sonde derivee 
d'ARNm extraits du modele tissulaire ou cellulaire de reference traite par le 
compose teste: 

- une hybridation efficace avec la banque rA/cB et aucun 
signal sur la banque rB/cA revele une absence de toxicite du compose sur le 

20 modele etudie 

- Phybridation de la sonde avec des clones de la banque 
rB/cA indique une toxicite induite par le compose teste. 

Des exemples duplication de constitutions de telles banques 
peuvent etre fournis par des modeles de culture d'hepatocytes, telle la lignee 
25 HepG2 f de cellules epith6liales renales, telle la lignee HK-2, ou de cellules 
endothelials, telle la lignee ECV304, traites par des agents toxiques tel 
P6thanoI, la camptothecine ou le PMA. 

Un exemple de choix peut egalement etre fourni par ('utilisation 
en cosmetologie de modeles de culture de peau traites ou non par des 
30 agents toxiques ou irritants. 

La presente demande a done egalement pour objet des 
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banques de criblage differentiel (entre les ADNc et les ARN), realisees a 
partir d'organes, de tissus ou de cultures cellulaires de reference traites avec 
des composes chimiques representatifs de grandes classes d'agents 
toxiques selon les abaques decrites dans la litterature. L'invention concerne 
5 aussi Petalement de ces banques sur des filtres ou sur des supports connus 
de rhomme de Tart (nitrocellulose, nylon...). Avantageusement ces supports 
peuvent etre des chips ou puces qui definissent ainsi des puces de 
genotoxicite. invention concerne en outre I'exploitation qui peut etre faite du 
sequen?age des differents clones qui constituent ces banques dans le but 

10 d'elucider les mecanismes mis en jeu par Taction des differents toxiques, 
ainsi que ('utilisation de ces banques pour les hybrider avec des sondes 
provenant de cellules ou de tissus traites par un compose chimique ou un 
produit pharmaceutique dont on veut ^valuer la toxicite. Avantageusement, 
Tinvention concerne des banques decides nucleiques telles que d6finies ci- 

15 avant, preparees a partir de cellules de la peau traitees en differentes 
conditions toxiques. invention concerne en outre un kit comprenant ces 
differentes banques differentielles de la peau. 

[.'invention concerne egalement fertilisation des methodes, 
acides nucleiques ou banques decrits ci-dessus pour evaluer (predire) ou 

20 ameliorer le potentiel th6rapeutique de composes tests 
(genopharmacologie). 

Dans cette utilisation, le principe mis en application est tres 
proche de celui decrit precedemment. Des banques differentielles de 
reference sont etablies entre les ADNc et les ARN d f une culture cellulaire ou 

25 d'un organe dans une situation controle et de leur equivalent mimant un 
modele de pathologie. L'efficacite therapeutique d'un produit peut alors etre 
6valuee en suivant sa capacite a antagoniser les variations qualitatives de 
I'expression genique qui sont specifiques du modele pathologique. Cela est 
mis en evidence par la modification du profit d'hybridation d'une sonde issue 

30 du modele pathologique sur les banques de references: sans traitement, la 
sonde n^ybride qu'avec la banque qui contient les signatures specifiques de 
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la maladie. Apres traitement avec un produit efficace, la sonde bien que 
provenant du modele pathologique hybride preferentiellement avec 1'autre 
banque, qui porte les signatures du modele equivalent sain. 

A cet 6gard, invention concerne egalement un procede de 
5' determination ou devaluation de I'efficacite therapeutique d'un compose test 
sur un echantillon biologique donne comprenant I'hybridation : 

- de banques differehtielles entre les ADNc et les ARN dudit 
echantillon biologique a I'etat sain et a (differents stades de developpement 
de) I'etat pathologique avec, 

10 - une preparation decides nucleiques de Echantillon biologique 

traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
analyse du degre d'hybridation avec les differentes banques. 

Un exemple d'une telle application peut etre foumi par un 

15 modele d'apoptose mimant certains aspects de la neurodegenerescence qui 
sont antagonises par des facteurs trophiques de reference. Ainsi les cellules 
derivees de pheochromocytomes PC12 differenciees en corps neuronaux en 
presence de NGF entrent en apoptose par retrait de ce facteur de 
croissance. Cette apoptose est accompagnee par expression de nombreux 

20 marqueurs de mort cellulaire programmee dont plusieurs sont regules par 
epissage alternatif et dont Papparition est inhibee par action d'IGFl. Deux 
banques issues de criblage differentiel qualitatif sont etablies a partir 
d'ARNm extraits de cellules PC 12 differenciees entrees en apoptose par 
retrait de NGF d'une part et a partir de PC12 differenciees sauvegardees de 

25 Tapoptose par ajout d'IGFl d'autre part. Sur ces banques peuvent §tre 
hybridees des sondes realisees ^ partir d'ARNm extraits de PC12 
differenciees entries en apoptose et dont la survie est am6lioree par 
traitement avec un produit neuroprotecteur a tester. L'efficacite de Tinversion 
des caracteristiques qualitatives induites par le compose test peut done etre 

30 appreciee par la capacite de la sonde a hybrider specifiquement les clones 
specifiques de la banque representative des cellules dont la survie est 
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amelior£e. Ce test peut par la suite etre utilise pour tester Tefficacite de 
derives du compose ou de tout autre nouvelle famille de composes 
neuroprotecteurs et en amSliorer le profil pharmacologique. 

Dans un mode de realisation particulier, le proced6 de 
5 Tinvention permet d'evaluer Tefficacite d'une compose test neuroprotecteur 
par hybridation avec une banque differentielle selon Tinvention entre une 
cellule nerveuse saine et cette cellule presentant un modele de 
neurodegenerescence. 

Dans un autre mode, il s'agit de tester un compose antkumoral 
10 sur des banques differentielles etablies a partir d'un echantillon de cellules 
tumorales et un echantillon sain. 

Comme indique ci-avant, le proc6d6 de Tinvention peut en outre 
etre utilise pour ameliorer les proprietes d'un compose, en testant differents 
derives pour ieur capacite a induire un profil d'hybridation proche de la 
is banque representative de Pechantillon sain. 

L'invention conceme egalement Tutilisation des methodes, 
acides nucleiques ou banques decrits ci-dessus en pharmacogenomique, 
i.e., pour evaluer (predire) la reponse d'un patient a un compose ou 
traitement test. 

La pharmacogenomique a pour ambition d'etablir des profils 
genetiques de patients afin de determiner quel traitement est susceptible 
d'etre couronne de succes pour une pathologie donnee. Les techniques 
decrites dans la presente invention permettent a cet egard d'etablir des 
banques d'ADNc representatives des differences qualitatives qui existent 
entre une situation pathologique qui repond a un traitement donne et une 
autre qui repond peu ou mal, susceptible d^tre Tobjet d'une autre strategie 
therapeutique. Ces banques de references etablies, elles peuvent §tre 
hybridees avec des sondes realisees a partir d'ARN messagers de patients. 
Les resultats d'hybridation permettent de savoir quel patient a un profil 
d'hybridation correspondent a la situation de r6pondeur ou de non r6pondeur 
et ainsi d'affiner le choix de traitement. 
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Dans cette application, le but est d'une part de proposer en 
fonction du patient le traitement le plus approprte, le plus susceptible d'etre 
couronne de succes et d'autre part d'enroler dans un traitement les patients 
les plus susceptibles d'y repondre avec succes. Comme dans les autres 
5 applications, deux banques de criblage differential qualitatif sont realisees: 
Tune a partir d'un module ou d'un echantillon pathologique connu pour 
repondre a un traitement, I'autre a partir d'un autre modele ou echantillon 
pathologique qui repond peu ou mal £ Taction therapeutique. Ces deux 
banques sont ensuite hybridees avec des sondes provenant d'ARNm extraits 

10 de biopsies de differents patients. Selon que ces sondes hybrident 
preferentiellement avec les 6pissages alternatifs specifiques de Tune ou 
I'autre situation, les patients peuvent etre repartis en repondeurs et en non 
repondeurs au traitement de reference qui a defini les modeles de depart. 

A cet egard, ['invention concerne egalement un proc6de de 

15 determination ou devaluation de la reponse d'un patient a un compose ou 
traitement test comprenant ('hybridation : 

- de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-repondeur ou mal-repondeur audit 

20 compose/traitement, avec, 

- une preparation d'acides nucleiques d'un 6chantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

25 Un exemple de choix de I'apport du criblage differentiel qualitatif 

a la pharmacogenomique est constitue par un criblage differentiel qualitatif 
entre deux tumeurs de meme origine histologique, Tune r6gressant lors du 
traitement par un compost antitumoral (par exemple un transfert d'un ADNc 
codant pour la proteine p53 sauvage par th6rapie genique), I'autre se 

30 montrant r6fractaire a ce traitement. La premiere retombee de la constitution 
de banques de differences qualitatives entre ces deux situations est de 
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determiner, par analyse des clones qui constituent ces banques, quels 
mecanismes moleculaires sont mobilises lors de la regression du premier 
modele et ne sont pas presents dans le deuxieme. 

Ensuite, ('utilisation de filtres ou tout autre support presentant les 
5 ADNc de ces banques permet de r6aliser des hybridations avec des sondes 
derivees d'ARNm de biopsies de tumeurs dont on veut anticiper la r6ponse 
audit traitement. Ces resultats permettent ainsi de proposer un enrolement 
optimise des patients dans un protocole clinique. 

Un exemple particulier de ce procede consiste a determiner la 

10 r6ponse de tumeurs a un traitement par le gene suppresseur de tumeur p53. 
II a en effet 6te decrit que certains patients et certaines tumeurs repondent 
plus ou moins bien a ce type de traitement (Roth et a). f Nature Medicine, 2 
(1995) 958). II est done important de pouvoir determiner quels types de 
tumeurs et/ou quels patients sont sensibles a un traitement par therapie 

15 genique par p53 sauvage, afin d'optimiser le traitement et de favoriser 
I'enrolement des patients dans les essais cliniques en cours. Le procede de 
Tinvention permet avantageusement de faciliter ces etapes en proposant des 
banques specifiques des qualites de cellules repondeuses et de cellules non 
repondeuses a p53. Des exemples de modeles cellulaires p53-sensibles ou 

20 resistants sont decrits par exemple par Sabbatini et al. (Genes Dev. 9 (1995) 
2184) ou par Roemer et al. (Oncogene 12 (1996) 2069). L'hybridation de ces 
banques avec des sondes derivees de biopsies de patients permet aisement 
d'evaluer leur potentiel repondeur. En outre les banques specifiques 
permettent egalement dldentifier des acides nucl6iques impliques dans la 

25 reponse a p53. 

La presente demande concerne done egalement 
Tetablissement de banques de criblage differentiel a partir d'echantillons 
pathologiques, ou de modeles de pathologie, qui repondent differemment d 
au moins un agent pharmacologique. Ces banques peuvent etre des 

30 banques restreintes, complexes ou autologues comme definies ci-dessus. 
Elle concerne aussi Tetalement de ces banques sur des filtres ou sur des 
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determiner, par analyse des clones qui constituent ces banques, quels 
mecanismes moleculaires sont mobilises lors de la regression du premier 
modele et ne sont pas presents dans le deuxieme. 

Ensuite, 1'utilisation de filtres ou tout autre support presentant les 
5 ADNc de ces banques permet de realiser des hybridations avec des sondes 
derivees d'ARNm de biopsies de tumeurs dont on veut anticiper la reponse 
audit traitement. Ces resultats permettent ainsi de proposer un enrolement 
optimise des patients dans un protocole clinique. 

Un exemple particulier de ce procede consiste a determiner la 

10 reponse de tumeurs a un traitement par le gene suppresseur de tumeur p53. 
II a en effet et6 d6crit que certains patients et certaines tumeurs repondent 
plus ou moins bien a ce type de traitement (Roth et al. a Nature Medicine, 2 
(1995) 958). II est done important de pouvoir determiner quels types de 
tumeurs et/ou quels patients sont sensibles a un traitement par therapie 

15 genique par p53 sauvage, afin d'optimiser le traitement et de favoriser 
I'enrolement des patients dans les essais cliniques en cours. Le procede de 
Tinvention permet avantageusement de faciliter ces etapes en proposant des 
banques specifiques des qualites de cellules repondeuses et de cellules non 
repondeuses a p53. Des exemples de modeles cellulaires p53-sensibles ou 

20 resistants sont decrits par exemple par Sabbatini et al. (Genes Dev. 9 (1995) 
2184) ou par Roemer et al. (Oncogene 12 (1996) 2069). L'hybridation de ces 
banques avec des sondes derivees de biopsies de patients permet aisement 
d'evaluer leur potentiel repondeur. En outre les banques specifiques 
permettent egalement d'identifier des acides nuc!6iques impliques dans la 

25 reponse a p53. 

La presente demande concerne done egalement 
Tetablissement de banques de criblage differentiel a partir d'echantillons 
pathologiques, ou de modeles de pathologie, qui repondent differemment a 
au moins un agent pharmacologique. Ces banques peuvent etre des 

30 banques restreintes, complexes ou autologues comme definies ci-dessus. 
Elle concerne aussi I'etalement de ces banques sur des filtres ou sur des 
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supports connus de I'homme de Tart (nitrocellulose, nylon...). 
Avantageusement ces supports peuvent etre des chips ou puces qui 
definissent ainsi des puces de pharmacogenomique. L'invention porte encore 
sur ('exploitation qui peut etre faite du sequengage des differents clones qui 

5 constituent ces banques dans le but d'elucider les mecanismes qui president 
aux differences de reponses d'echantillons pathologiques a differents 
traitement, ainsi que Putilisation de ces banques pour les hybrider avec des 
sondes provenant de biopsies provenant de situations pathologiques dont on 
veut anticiper la reponse au traitement de reference qui definit les banques. 

10 La presente invention decrit ainsi que des variations dans les 

formes et/ou profils d'epissages constituent des sources de marqueurs de 
pharmacogenomique, c'est-a-dire des sources de marqueurs permettant la 
mise en evidence de la capacite et de la maniere d'un patient a repondre a 
des traitements. A cet egard, invention a done egalement pour objet 

15 I'utilisation de I'intervariabilite, entre individus, des isoformes generees par 
epissage alternatif (analyse du spliceome) comme source de marqueurs de 
pharmacogenomique. L'invention concerne aussi Putilisation de modifications 
d'epissage induites par des traitements comme source de marqueurs de 
pharmacogenomique. Ainsi, comme explique ci-avant, les methodologies 

20 DATAS de l'invention permettent de generer des acides nucleiques 
representatifs des differences qualitatives entre deux echantillons 
biologiques. Ces acides nucleiques, ou des formes derivees (sondes, 
amorces, acides comptementaires, etc.) peuvent etre utilises pour Tanalyse 
du spliceome de sujets, en vue de mettre en evidence leur capacite/maniere 

25 de repondre a des traitements, ou leur predisposition a tel 
traitement/pathologie, etc. 

Ces differents exemples generaux illustrent I'interet des 
banques de criblage differential qualitatif dans des etudes de genotoxicite, 
30 genopharmacologie, pharmacogenomique ainsi que dans des recherches de 
cibles d'interet diagnostique ou therapeutique. Ces banques sont issues du 
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clonage des differences qualitatives qui existent entre deux situations 
physiopathologiques. Puisqu'une autre utilisation des ADNc representatifs de 
ces differences qualitatives est de constituer des sondes destinees a cribler 
une banque d'ADN genomique dont les caracteristiques ont ete decrites ci 
5 avant, une telle approche peut etre egalement mise en ceuvre pour toute 
6tude de genotoxicite, g6nopharmacologie et pharmacogenomique ainsi que 
d'identification de gene. Dans les etudes de genotoxicite par exemple, les 
clones genomiques restreints par la taille de leurs insertions statistiquement 
a un seul intron ou a un seul exon sont classes sur des filtres en fonction de 

10 leur hybridation avec des sondes DATAS provenant de Tanalyse differentiate 
qualitative entre une population cellulaire ou un tissu de reference et les 
memes cellules ou tissu traites par un compose toxique de reference. Ces 
clones representatifs des differentes classes de toxicite etant selectionnes, il 
peut ensuite etre procede a une hybridation de ces clones avec une sonde 

15 deriv6e des ARN messagers totaux d'une meme population cellulaire ou d'un 
meme tissu traite par un compost dont on veut apprecier le potentiel toxique. 

D^utres avantages et applications de la presente invention 
apparaTtront a la lecture des exemples qui suivent, qui doivent etre 
consideres comme illustratifs et non limitatifs. Les champs duplication de 

20 invention sont represents sur la figure 7. 

LEGENDE DES FIGURES 

Figure 1. Representation schematique des criblages differentiels selon 
25 Tinvention (figure 1A) utilisant une (figure 1B) ou deux (figure 1C) 
hybridations, et utilisation des acides nucl6iques (figure 1D). 

Figure 2. Representation sch6matique decrivant Tobtention d'hybrides 
ARN/ADN permettant de caracteriser les sequences ARN simple brin, 
30 signatures specifiques de T6tat pathologique ou de T6tat sain. 
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Figure 3. Representation schematique ctecrivant un moyen permettant 
d'isoler et de caracteriser par sequen$age les sequences d'ARN simple brin 
specifiques d'une situation pathologique ou d'une situation saine. 

5' Figure 4. Representation schematique decrivant un autre moyen 

permettant de caracteriser par sequengage tout ou une partie des ARNs 
simple brin specifiques d'une situation pathologique ou d'une situation saine. 

Figure 5. Representation schematique permettant d'isoler les produits 
10 d'epissages altematifs grace a des structures R-loop 

Figure 6. Representation schematique du criblage differentiel qualitatif 
par restriction de boucles (formation d'homoduplexes ADNcdb/ADNc et 
extractions des informations, Figure 6A) et description des informations 
15 obtenues (Figure 6B). 

Figure 7. Apports du criblage differentiel qualitatif aux differentes 
etapes de la recherche et du developpement pharmaceutique. 

20 Figure 8. Isolation d'un domaine differentiellement episse dans le 

modele grb2/grb33. A) Production des ARNs synthetiques de grb2 et de 
grb33. B) Suivi des premieres 6tapes de DATAS conduisant a la 
caracterisation d'un fragment ARN correspondant au domaine 
differentiellement episse ; 1 : ARN de grb2, 2 : Hybridation entre I'ARN de 

25 grt>2 et I'ADNc de grb33, 3 : Hybridation entre TARN de grt>2 et TADNc de 
grb2, 4 : Hybridation entre I'ARN de grb2 et de Teau, 5 : Surnageant apres 
passage sur billes Streptavidine de (2), 6 : Surnageant apres passage sur 
billes Streptavidine de (3), 7: Surnageant apres passage sur billes 
Streptavidine de (4), 8 : Digestion du duplex ARN grt>2 / ADNc grb33 a la 

30 Rnase H, 9 : Digestion du duplex ARN grb2 / ADNc grb2 a la Rnase H, 10 : 
Digestion de I'ARN grb2 a la Rnase H, 11 : pareil que (8) apres passage sur 
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colomne d'exclusion, 12 : pareil que (9) apres passage sur colomne 
d'exclusion, 13 : pareil que (10) apres passage sur colomne d'exclusion. 

Figure 9 . Representation des populations d'ARNs non appariees 
5 issues de la digestion par la Rnase H a partir de duplexes ARN / ADNc 
simple brin provenant de cellules HepG2 traitees ou non a I'ethanol. 

Figure 10. Representation des populations d'ADNc double brin 
generees par une des variantes de DATAS. 1 a 12: PCRs a partir de 
10 populations de boucles d'ARNs issues de la digestion a la Rnase H, 13 : 
PCR a partir d'ADNc total. 

Figure 11. Application de la variante de DATAS faisant intervenir les 
ADNc double brin sur le modele grb2/grb33. A) Analyse sur gel d'agarose 

15 des complexes apres hybridation : 1 : ADNc double brin grb2 / ARN grb33, 
2 : ADNc double brin grb2 /ARN grt>2, 3 : ADNc double brin grb2 / eau. B) 
Digestion des echantillons 1,2 et 3 de A) par la nuclease S1 et la nuclease 
" Mung Bean " : 1 a 3 : complexes 1 a 3 avant traitement au glyoxal ; 4 a 6 : 
complexes 1 a 3 apres traitement au glyoxal ; 7 a 9 : Digestions de 1 a 3 par 

20 nuclease S1 ; 10 a 12 : Digestions de 1 a 3 par nuclease Mung Bean. 

Figure 12. Application de la variante de DATAS faisant intervenir les 
ADNc simple brin et la Rnase H sur un systeme de cellules HepG2 traitees 
ou non a I'ethanol 0,1 M pendant 18 heures. Les inserts clones ont ete 
25 transferes sur membrane apres electrophorese sur gel d'agarose et soumis a 
hybridation & I'aide de sondes correspondant aux situations traitees (Tr) ou 
non (NT). 

Figure 13. Mode operatoire pour 6valuer le potentiel toxique d'un 
30 produit. 
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Figure 14. Mode operatoire pour suivre Pefficacite d'un produit. 

Figure 15. Mode operatoire pour Studier la susceptibilite d'une 
situation pathologique a un traitement. 

5 

Figure 16. Analyse d'hybridation differentielle de clones issus de 
DATAS a partir d'ARNs extraits de cellules induites et d'ADNc extraits de 
cellules non induites. A) Utilisation de colonies bacteriennes deposees et 
lysees sur membrane. B) Southern Blot effectu6 a partir d'une selection de 
10 clones de A. 

Figure 17. Sequences nucleotidique et peptidique de ASHC (SEQ ID 
NO:9et10). 

15 Figure 18. Tests de cytotoxicity et d'apoptose sur cellules HepG2 

traitees A) a I'ethanol ; B) a la camptothecine ; C) au PMA. 

Figure 19. Reactions de RT-PCR effectuees a partir d'ARNs extraits 
de cellules HepG2 traitees ou non (NT) par I'ethanol (Eth.), la camptothecine 
20 (Camp.) et le PMA (PMA) permettant ('amplification de fragments 
correspondants a des domaines de MACH-a, BCL-X, FASR et beta-actine 
comme controle de normalisation. 

Dans les exemples et la description de Invention, il est fait references 
25 aux sequences de la Liste de Sequences, qui contient le texte libre suivant: 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 
30 <223> OLIGO 

<223> OLIGO 
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<223> QLIGO 
<223> OLIGO 
<223> OLIGO 
<223> OLIGO 
5 <223> OLIGO 

<223> OLIGO 

EXEMPLES 

10 1. CLONAGE DIFFERENTIEL DES EPISSAGES ALTERNATIFS ET 

AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc SIMPLE-BRINS 

Les ARN messagers correspondant a deux situations, I'une normale 
15 (mN) et Tautre pathologique (mP) t sont isoles a partir de biopsies ou de 
cellules en culture. Ces ARN messagers sont convertis en ADN 
complementaires (cN) et (cP) a I'aide de reverse transcriptase (RT). Des 
hybrides mN/cP et cN/mP sont ensuite realises en phase liquide (se reporter 
au schema de la figure 2 illustrant un des deux cas aboutissant a la 
20 formation de cN/mP). 

Ces hybrides sont avantageusement realises en emulsion phenolique 
(technique PERT ou Phenol Emulsion DNA Reassociation Technique) 
maintenue par thermocycles (Miller, R.,D. and Riblet, R., 1995, Nucleic Acids 
Research, vol 23, n°12, pp 2339-2340). Typiquement, cette etape 
25 d'hybridation est realisee entre 0,1 a 1 jag d'ARN polyA+ et 0,1 a 2\ig d'ADN 
complementaire dans une emulsion formee d'une phase aqueuse (tampon 
phosphate de sodium 120mM, NaCI 2,5M, EDTA 10mM) et d'une phase 
organique representant 8% de la phase aqueuse et constitute de phenol 
bidistille. 

30 Une autre technique est egalement avantageusement 

employee de fa?on a obtenir des heteroduplex : a Tissue de la transcription 
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inverse, TADNc neosynthetise est separe de i'amorce oligodT biotinylee sur 
colonne d'exclusion. 0,1 a 2\iq de cet ADNc est coprecipite avec 0,1 a 1^g 
d'ARN polyA+ en presence de 0,3M d'acetate de sodium et de deux volumes 
d'ethanol. Ces acides nucteiques coprecipites sont repris dans 30jal d'un 
5 tampon d'hybridation qui contient 80% de formamide, 40mM de PIPES 
(piperazinebis(2-ethanesulfonic acid)) ph6,4, 0,4M de NaCI et 1mM d'EDTA. 

Les acides nucleiques en solution sont denatures par chauffage 
10mn a 85°C puis leur hybridation est r6alisee pendant au moins 16h et 
jusqu'a 48h a 40°C. 

10 L'interet de la technique d'hybridation en formamide est de 

permettre des conditions de plus forte selectivity lors de Tappariement des 
brins d'ADNc et d'ARN. 

A Tissue de chacune de ces deux techniques d'hybridation, 
nous disposons d'heteroduplex ARN/ADN dont la perfection d'appariement 

15 depend de Pefficacite de la RT a synthetiser la longueur totale des ADNc. 
Demeurent egalement sous forme de simples brins les regions d'ARN (et 
d'ADN) qui correspondent aux epissages altematifs qui differencient les deux 
etats physiopathologiques etudies. 

Le but de la methode est ensuite de caracteriser rinformation 

20 genetique port6e par ces boucles d'epissage. 

Pour cela, les heteroduplex sont purifies par capture des ADNc 
(amorces avec des oligodT biotinyles) grace a des billes portant des 
groupements streptavidines. Avantageusement ces billes sont de billes 
douees de proprietes magnetiques, ce qui permet de les separer des ARN 

25 non engages dans les heteroduplex par action d'un separateur magnetique. 
De telles billes et de tels separateurs sont disponibles commercialement. 

Sont isol6s a ce stade de la procedure les heteroduplex et les 
ADNc non engages dans des hybridations avec des ARN. Ce materiel est 
ensuite soumis a Taction de la RNaseH qui va sp6cifiquement hydrolyser les 

30 regions d'ARN hybridees avec les ADNc. Les produits resultant de cette 
hydrolyse sont d'une part les ADNc et d'autre part les fragments d'ARN qui 
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correspondent aux boucles d'epissage ou aux regions non hybridees du fait 
du rendement partiel de la transcriptase inverse. Les fragments d'ARN sont 
separes de I'ADN par separation magnetique selon le meme mode 
operatoire que celui mentionne plus haut et par digestion avec de la DNase 
5 exempte de toute contamination par une activite Rnase. 

1.1. Validation de la technique PATAS sgr les variants 
d'epissage du gene Grb2 

Une mise en evidence de la faisabilite de cette approche a ete 
10 realisee sur un systeme in-vitro utilisant un ARN correspondant a la region 
codante de Grb2 d'une part et un ADNc simple brin complementaire a la 
region codante de Grb3.3. Grb2 est un gene possedant une phase codante 
de 651 paires de bases. Grb33 est une isoforme de grb2 generee par 
epissage alternatif et comprenant une deletion de 121 paires de bases dans 
le domaine fonctionnel SH2 de grb2 (Fath et.al, Science (1994), 264, 971-4). 
Les ARNs de Grb2 et de Grb33 sont synthetises selon les techniques 
connues de Thomme du metier a partir d'un plasmide contenant la sequence 
codante de Grb2 ou de Grb33 sous controle du promoteur T7 a I'aide du kit 
RiboMax (Promega). L'analyse des produits demontre une synthase 
homogene (figure 8A). Dans un but de visualisation, TARN de Grb2 a 
egalement ete rendu radioactif par incorporation d'une base marquee lors de 
la transcription in-vitro a I'aide du kit RiboProbe (Promega). Les ADNc de 
Grb2 et de Grb3.3 ont §te synthases par transcription inverse a partir des 
ARNs synth6tiques produits ci-dessus, du kit Superscript II (Life 
Technologies) et d'une amorce oligonucleotidique biotinylee commune a 
Grb2 et a Grb33 correspondant au complementaire de la sequence (618- 
639) de Grb2. Les ARNs et ADNcs ont ete traites selon les indications des 
fournisseurs (promega, Life Technologies), purifies sur colonne d'exclusion 
(Rnase free sephadex G25 ou G50, 5 Prime, 3 Prime) et quantifies par 
spectrophotometrie. 

Les premieres etapes de DATAS ont ete appliquees en 
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associant, en suspension 10ng d'ARN marque de Grb2 avec : 

1 . 1 00 ng d'ADNc de grb33 biotinyle, 

2. 100 ng d'ADNc de grb2 biotinyte, 

3. del'eau 

5 ' dans 30 pi d'un tampon d'hybridation qui contient 80% de formamide, 40 mM 
PIPES (pH 6,4), 0,4 M NaCI, 1 mM EDTA. Les acides nucleiques sont 
denatures par chauffage 10 mn a 85 °C, puis I'hybridation est realis6e 
pendant 16 heures a 40°C. Apres capture a I'aide de billes streptavidine, les 
echantillons sont traites a la RNase H comme decrit precedemment. 

10 L'analyse de ces etapes est realisee par electrophorese sur gel 

d'acrytamide £ 6% suivi d'un traitement des gels a I'aide d'un Instant Imager 
(Packard Instruments) permettant la qualification et la quantification des 
especes issues de TARN de grb2 marque (figure 8B). Ainsi, les puits 2,3 et 4 
indiquent que les duplexes grb2/grb33 et grb2/grb2 se sont formes de fagon 

15 quantitative. La migration du complexe grb2/grb33 est retardee par rapport a 
celle de TARN de grb2 (puits 2) alors que celle du complexe grb2/grb2 est 
augmentee (puits 3). Les puits 5,6 et 7 correspondent aux echantillons non 
retenus par les billes streptavidine demontrant que 80% des complexes 
grb2/grb33 et grb2/grt>2 ont ete retenus sur les billes alors que TARN de grb2 

20 seul, non biotinyle, se retrouve exclusivement dans le sumageant des billes. 
Le traitement 3 la Rnase H libere, outre les nucleotides libres qui migrent 
plus vite que le bleu de Bromophenol (BPB) une espece migrant en de9a du 
bleu de xylene Cyanol (XC) (marque par une fleche sur la figure) et ce 
specifiquement dans le puits 8 correspondant au complexe grb2/grb33 par 

25 rapport aux puits 9 et 10 qui correspondent au complexe grb2/grb2 et a 
TARN de grb2. Les puits 1 1 ,12 et 13 correspondent aux puits 8,9 et 10 apres 
passage des echantillons sur une colomne d'exclusion pour eliminer les 
nucleotides libres. La migration observee dans les puits 8 et 11 est celle 
attendue pour une molecule d'ARN correspondant a la deletion de 121 

30 nucleotides differencial grb2 de grb33. 

Ce r6sultat montre bien la possibilite d'obtenir les boucles 
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d'ARN gen6rees. par la formation d'heteroduplex entre deux sequences 
derivees de deux isoformes d'epissage. 

1,2. Application de la technique DATAS a la generation de 
5 banaues aualitatives de cellules hSo atiques dans un etat sain et toxiaue 

Une situation plus complexe a ete etudiee. Dans le cadre de 
['application de la technologie DATAS comme outil predictif de toxicite de 
molecules, des cellules humaines de type hepatocytaire, HepG2, ont 6te 
traitees par de I'ethanol 0,1 M pendant 18 heures. Les ARNs ont ete extraits 

10 a partir des cellules traitees ou non. La variante de DATAS d6crite ci-dessus 
(preparation d'ADNc sb biotinyles, hybridations croisees en phase liquide, 
application d'un champs magn6tique pour separer les especes, traitement 
RNaseH) a ete appliquee avec les cellules non traitees en situation de 
reference (ou situation A) et les cellules traitees en situation test (ou situation 

15 B) (figure 9). Les ARNs extraits n'6tant pas marques radioactivement , la 
visualisation des populations d'ARN generees par digestion a la RnaseH est 
realisee en effectuant une reaction d'6change du phosphate en 5' des ARNs 
par un phosphate marque, a I'aide de polynucleotide kinase de T4 et de 
gamma-P 32 ATP. Ces marquages sont ensuite deposes sur un gel 

20 d'acrylamide/uree et analyses par exposition a Taide d'un Instant Imager 
(Packard Instruments). Des signatures complexes issues des hybridations 
A/B et B/A peuvent alors etre visualisees avec un premier groupe de signaux 
migrant faiblement dans le gel et correspondant a des sequences d'acides 
nucleiques de taille importante et un deuxieme groupe de signaux migrant 

25 entre 25 et 500 nucleotides. Ces signatures sont d'intensite beaucoup plus 
faible a partir de la situation A/A suggerant que I'ethanol peut induire une 
reprogrammation de Tepissage des ARNs, traduite par I'existence de signaux 
en A/B et B/A. 



30 1.3. Clonaoe et Preparation de hangues a partir des acides 

nMQlQiqugs identify. 
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Plusieurs variantes experimental sont ensuite envisageables 
pour doner ces fragments d'ARN resistant a Taction de la Rnase H: 

A. Une premiere approche consiste a isoler ces boucles et a les 
5 doner (Figure 3). 

Selon cette approche, il est procede a une ligation 
d'oligonucleotides a chacune des extremes par action de la RNA ligase 
selon les conditions connues de I'homme de Tart. Ces oligonucleotides sont 
ensuite utilises comme amorces pour effectuer une RT PCR. Les produits de 
10 PCR sont clones et cribles avec des sondes d'ADN complementaires totales 
correspondant aux deux situations physiopathologiques d'interet. Seuls les 
clones hybridant pr6ferentiellement avec une seule des deux sondes 
contiennent les boucles d'epissage qui sont ensuite sequencees et/ou 
utilisees pour generer des banques. 

15 

B. La seconde approche (Figure 4) consiste a effectuer une 
transcription inverse sur TARN simple brin libere des heteroduplex apres 
action de la RNaseH, initiee a I'aide d'amorces au moins en partie aleatoires. 
Ainsi, il peut s'agir d'amorces aleatoires en 3' et en 5\ d'amorces aleatoires 

20 en 3' et d6termin6es en 5\ ou encore d'oligonucleotides semi-aleatoires, 
c^st-a-dire comprenant une zone de degen6rescence et une zone d6finie. 

Selon cette strategie, les amorces sont done susceptibles de 
s^ybrider soit n'importe ou sur TARN simple brin, soit a chaque succession 
de bases fixee par le choix de I'amorce semi-aleatoire. Une PCR avec des 

25 amorces correspondant aux oligonucleotides decrits ci-dessus permet 
ensuite d'obtenir des sequences d6rivees des boucles d'epissage. 

La figure 10 (puits 1 ^ 12) montre I'analyse sur gel d'acrylamide 
des fragments de PCR obtenus d partir de plusieurs essais DATAS et 
couplee a ['utilisation des oligonucleotides semi-aleatoires suivants: 

30 GAGAAGCGTTATNNNNNNNAGGT (SEQ ID NO: 1 , X=T) 
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G AG AAGCGTTATN N N N N N N AGG A (SEQ ID NO: 1, X=A) 

GAGAAGCGTTATNNNNNNNAGGC (SEQ ID NO: 1, X=C) 
GAGAAGCGTTATNNNNNNNAGGG (SEQ ID NO: 1, X=G) 
La comparaison avec la complexity des signaux obtenus en 
5 utilisant les memes oligonucleotides, mais de I'ADNc total comme matrice 
(puits 13) d6montre que DATAS a permis de filtrer ("profiler") des 
informations correspondant a des differences qualitatives. 

Cette variante a ete utilis6e afin de doner un evenement 
correspondant au domaine ARN de grb2 genere par action de la Rnase H a 
10 partir du duplex ARN grb2 / ADNc simple brin de grb33 selon le protocole 
decrit prec6demment (exemple 1.1.). A cette fin, un oligonucleotide de 
sequence : GAGAAGCGTTATNNNNNNNNTCCC (SEQ ID NO: 2), choisi sur 
le modele G AG AAG CGTTATN N N N N N N WX YZ (dans lequel N est d6fini 
comme precedemment, W, X et Y represented chacun une base fixe 
is determinee, et Z represente soit une base d6terminee soit un groupe 3-OH, 
SEQ ID NO: 3) et s6lectionne pour amplifier un fragment dans la deletion de 
grt>2 a ete utilise, permettant de generer un fragment PGR dont le clonage et 
le sequengage a demontre qu'il etait effectivement issu du domaine del6te 
degrt>2 (194-281 dansgrb2). 

20 

Ces deux approches permettent done la production de 
compositions decides nucleiques representatifs des epissages differentiels 
dans les deux situations testees qui peuvent etre employees comme sondes 
ou pour construire des banques d'ADNc de differences qualitatives. La 
25 capacite de la technologie DATAS a generer des banques profilees d'ADNc 
representatives de differences qualitatives est egalement illustree par 
Texemple 1.4. suivant. 



1,4. Production de banques profilees representatives de 
30 pilules endothelials humging? 

Cet exemple a ete realise a partir d'une lignee de cellules 
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endothelials humaines (ECV304). L'analyse qualitative de I'expression 
gSnetique a ete rSalisee d partir d'ARN cytosoliques extraits de cellules en 
proliferation, d'une part, et de cellules en anoTkis (apoptose par privation de 
support d'attachement), d'autre part. 
5 Les cellules ECV ont ete cultivees en milieu 199 supplements 

en sels de Earle (Life Sciences). Leur mise en anoTkis a 6t6 r6alis6e par 
passage pendant 4 heures sur boTtes de culture traitees au polyHEMA. Lors 
de la preparation des ARN, les cellules ont ete lysees dans un tampon 
contenant du Nonidet P-40. Les noyaux sont ensuite ecartes par 

10 centrifugation. La solution d'extrait cytoplasmique a 6te ensuite ajustee de 
maniere a fixer de fa$on specifique TARN a la matrice de silice Rneasy selon 
les instructions de la societe Qiagen. Apres lavage, les ARN totaux sont 
elues dans de I'eau traitee au DEPC. Les ARNs messagers sont prepares £ 
partir des ARNs totaux par s6paration sur billes magnetiques Dynabeads 

is oligo (dT) 25 (Dynal). Apres avoir mis en suspension les billes dans un 
tampon de fixation, TARN total est incube pendant 5 min a temperature 
ambiante. Apres separation magn&ique et lavage, les billes sont reprises 
dans un tampon d'elution pour une incubation a 65°C qui libere les ARNs 
messagers. 

20 Les syntheses d'ADN premier brin sont effectuees a partir de$ 

ARNs messagers en utilisant la Reverse Transcriptase Superscript II ou 
ThermoScript (Life Technologies) a Taide d'amorces olido (dT). Apr§s 
RnaseH, les nucleotides libres sont elimines par passage sur colonne 
Sephadex G50 (5 Prime- 3 Prime). Apres extraction au phenol / 

25 Chloroforme et precipitation a Tethanol, les 6chantillons sont quantifies par 
absorbance UV. 

Les quantites requises d'ARN et d'ADNc (en Toccurrence 
200ng de chaque) sont combinees et precipitees d Tethanol. Les 
6chantillons sont repris dans un volume de 30jil dans un tampon 

30 d'hybridation (Hepes (pH 7.2) 40 mM, NaCI 400mM, EDTA 1mM) 
supplements de formamide desionisee (80% (v/v), sauf indication contraire). 
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Apres denaturation 5 min a 70°C, les echantillons sont incubes sur la nuit a 
40°C. 

Les billes Streptavidine (Dynal) sont lavees puis 
reconditionnees dans un tampon de fixation (2X= Tris-HCI (pH 7,5) 10 mM, 
5 NaCI 2M, EDTA 1 mM). Les echantillons d'hybridation sont amenes a un 
volume de 200 |il avec de I'eau puis ajustes a 200 ^il de billes pour une 
incubation de 60 min a 30°C. Apres capture sur aimant et lavages des billes, 
celles-ci sont reprises dans 150 de tampon RnaseH puis incubees 
pendant 20 min a 37°C. Apres capture sur aimant, les regions non hybridees 
10 ont et§ relarguees dans le surnageant qui est traite a la Dnase puis extrait 
au phenol acide / chloroforme puis precipite a I'ethanol. Les precipitations d 
I'6thanol de faibles quantites d'acides nucleiques sont effectuees a I'aide 
d'un polymere commercial SeeDNA (Amersham Pharmacia Biotech) 
permettant de recuperer de fagon quantitative des acides nucleiques a partir 
de solutions tres diluees (de I'ordre du ng/ml). 

La synthese d'ADNc a partir des echantillons d'ARNs 
provenant de Taction de la RnaseH est effectuee a partir d'hexanucleotides 
al6atoires a Taide de Superscript II Reverse Transcriptase. L'ARN est 
ensuite degrade a Taide d'un melange de RnaseH et de Rnase T1. 
L'amorce, les nucleotides non incorpores et les enzymes sont s6pares de 
TADNc a Taide d'une cartouche " GlassMAX Spin M . L'ADNc correspondant 
aux boucles d f epissage est ensuite soumis a une reaction de PCR en 
utilisant des oligonucleotides de type semi-al6atoire deja decrits plus haut 
dans Tinvention. En I'occurrence les oligonucleotides choisis sont : 
GAGAAGCGTTATNNNNNCCA (SEQ ID NO: 4) 
La reaction de PCR est r6alisee a I'aide de Taq Polymerase sur 30 
cycles : 

• D§naturation initiate : 94°C pdt 1 min. 

• 94°Cpdt30s 

• 55°Cpdt30s 

• 72°Cpdt30s 
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• Extension finale : 72°C pdt 5 min. 

Les produits de PGR ont 6te clones dans le vecteur pGEM-T 
(Promega) possedant un T flottant aux extremites 3' afin de faciliter ie 
clonage de fragments issus de I'activite de la Taq Polymerase. Apres 

5* transformation dans les bacteries JM109 competentes (Promega), les 
colonies obtenues sont repiquees sur ftltre de nitrocellulose, et hybrid6es 
avec des sondes derivees de produits de PCR effectuees sur des ADNc 
totaux des cellules en proliferation d'une part et en anoTkis d'autre part. Pour 
ces PCR les memes oligonucleotides GAGAAGCGTTATNNNNNCCA sont 

10 utilises. Dans une premiere realisation experimental, 34 clones hybridant 
preferentiellement avec la sonde des cellules en apoptose et 13 clones 
hybridant preferentiellement avec la sonde des cellules en proliferation ont 
ete isoles. 

Parmi ces 13 clones, 3 clones contiennent le meme fragment 
is d'ADNc qui derive du domaine SH2 de la proteine SHC. 

La sequence de ce fragment est la suivante : 
CCACACCTGGCCAGTATGTGCTCACTGGCTTGCAGAGTGGGCAG 
CCAGCCTAAGCATTTGCACTGG (SEQ ID NO: 5) 

^utilisation d'amorces de PCR qui encadrent le domaine SH2 
20 de SHC (oligoS' : GGGACCTGTTTGACATGAAGCCC (SEQ ID NO:6) ; 
oligo3': CAGTTTCCGCTCCACAGGTTGC (SEQ ID NO:7)) a permis de 
caracteriser la deletion du domaine SH2 de SHC qui est observ6e 
specifiquement dans les cellules ECV en anoTkis. Avec ce couple d'amorce, 
un seul produit d'amplification correspondant a un fragment d'ADNc de 382 
paires de bases qui contient le domaine SH2 integre est obtenu a partir 
d'ARN de cellules ECV en phase exponentielle. Un fragment additionnel de 
287 paires de bases est observe lorsque la PCR est realisee £ partir d'ARN 
de cellules en anoTkis. Ce fragment supplemental derive d'un ARN 
messager derive du messager de SHC mais presentant une deletion. 
La sequence de cette deletion est la suivante : 
GTACGGGAGAGCACGACCACACCTGGCCAGTATGTGCTCACTGG 
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CTTGCAGAGTGGGCAGCCTAAGCATTTGCTACTGGTGGACCCTGAGGG 
TGTG (SEQ ID NO: 8). 

Cette deletion correspond aux bases 1198 a 1293 de la phase 
ouverte du messager codant pour les formes de 52kDa et 46kDa de la 
5 proteine SHC (Pelicci, G. et al, 1992, Cell, 70, pp93-104). 

Les donn§es stmcturales des domaines SH2 ainsi que la 
litterature indiquent qu'une telle deletion aboutit £ la perte de I 'affinite pour 
les phosphotyrosines puisqu'elle englobe les acides amines impliques dans 
les interactions avec les tyrosine phosphorylees (Waksman, G. et al, 1992, 
10 Nature, vo!358, pp646-653). Les proteines SHC 6tant des adapteurs qui 
connectent differents partenaires par leurs domaines SH2 et PTB 
(PhosphoTyrosine Binding domain), cette deletion genere done un dominant 
n6gatif naturel de SHC que nous appelons ASHC. Les domaines SH2 des 
proteines dont les genes sont sequences 6tant portes par deux exons, il est 
15 vraisemblable que la deletion identifiee par la m6thode DATAS correspond a 
un exon altematif du gene SHC. 

Les sequences proteique et nucleique de ASHC sont les 
representees sur la Figure 17 (SEQ ID NO: 9 et 10). 

Le domaine SH2 de SHC etant implique dans la transduction 
20 de nombreux signaux impliques dans la proliferation et la viability cellulaires, 
I'examen de la sequence de ASHC permet d'anticiper ses proprietes de 
dominant nSgatif sur la proteine SHC et sa capacite d'interferer avec 
different signaux cellulaires. 

L'invention conceme §galement cette nouvelle forme epissee 
25 de SHC, le domaine proteique correspondant a Tepissage, tout anticorps ou 
sonde nucleique permettant sa detection dans un 6chantillon biologique, et 
leurs utilisation diagnostique ou therapeutique, par exemple. 

L'invention concerne en particulier tout variant de SHC comprenant au 
moins une deletion correspondant aux bases 1198 a. 1293, plus 
30 particulierement une delation de la sequence SEQ ID NO: 8. ^invention 



WO 99/46403 



65 



PCT/FR99/00547 



conceme plus sp6cifiquement le variant ASHC ayant ia sequence SEQ ID 
NO: 9, cod6 par la sequence SEQ ID NO: 10. 

(.'invention concerne aussi toute sonde nucleique, oligonucleotide ou 
anticorps permettant d'identifier le variant ASHC ci-dessus, et/ou toute 
5 alteration du rapport SHC/ASHC dans un echantillon biologique. II peut s'agir 
notamment d'une sonde ou oligonucleotide complementaire de tout ou partie 
de la sequence SEQ ID NO: 8, ou d'un anticorps dirige contre le domaine 
proteique cod6 par cette sequence. De telles sondes, oligonucleotides ou 
anticorps permettent de detecter la presence de la forme non epissee (e.g., 

10 SHC) dans un echantillon biologique. 

Les materiels peuvent en outre §tre utilises en parallele avec des 
sondes, oligonucleotides et/ou anticorps sp6cifiques de la forme episs6e 
(e.g., ASHC), c'est-a-dire correspondant par exemple a la region de jonction 
resultant de Pepissage (localisee autour du nucleotide 1198 de la sequence 

15 SEQ ID NO: 10). 

De tels materiels peuvent etre utilises pour le diagnostic de 
pathologies liees a une immunodepression (cancer, traitement 
immunosuppresseur, SIDA, etc.). 

Uinvention concerne aussi tout proced6 de criblage de molecules 

20 base sur le blocage (i) du domaine episse dans la proteine SHC (notamment 
pour induire un etat de tolerance immunitaire par exemple dans les maladies 
autoimmunes ou les rejets de greffes et les cancers) ou (ii) des gains de 
fonction acquis par la proteine ASHC. 

Uinvention concerne en outre Putilisation therapeutique de ASHC, et 

25 notamment pour le traitement de cellules cancereuses ou de cancers (ex 
vivo ou in vivo) dans lesquels une hyperphosphorylation de la proteine SHC 
peut Stre mise en evidence, par exemple. A cet egard, Invention concerne 
aussi tout vecteur, notamment viral, comprenant une sequence codant pour 
ASHC. II s'agit pr6ferentiellement d'un vecteur capable de transferer des 

30 cellules cancereuses ou en proliferation, telles que des cellules musculaires 
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lisses, des cellules endotheliaies (restenose), des fibroblastes (fibroses), de 
preference d'origine mammifere, notamment humaine. Comme vecteur viral, 
on peut citer notamment des vecteurs adenoviraux, retroviraux, AAV, herpes, 
etc. 

2. CLONAGE DIFF^RENTIEL DES EPISSAGES ALTERNATIFS ET 
AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc DOUBLE-BRINS (FIGURE 5). 

Les ARNs messagers correspondants aux situations normales 
(mN) et pathologiques (mP) sont produits, ainsi que les ADNs 
complementaires double brin correspondants (dsN et dsP) par des 
protocoles classiques de biologie moleculaire. Des structures de type "R- 
loop" sont alors obtenues en hybridant mN avec dsP et mP avec dsN dans 
une solution contenant 70% de formamide. Les domaines nucleiques 
differentiellement episs6s entre la situation N et P resteront sous forme 
d'ADN double brin. Les simples brins d'ADN deplaces sont alors traites au 
glyoxal afin d'eviter le redeplacement du brin d'ARN lors du retrait de la 
formamide. Apres retrait de fa formamide et du glyoxal puis traitement & la 
RNAseH, nous nous retrouvons avec des structures de type abeille, les 
ADNs simples brin non apparies representant les ailes de I'abeille et le 
domaine double brin appareille d'interet representant le corps de I'abeille. 
^utilisation d'enzymes qui degradent sp6cifiquement TADN simple brin 
comme la nuclease S1 ou la Mung Bean nuclease permet isolation de I'ADN 
reste sous forme double brin qui est ensuite clone puis sequence. Cette 
deuxieme technique permet Tobtention directe d'une empreinte ADN double 
brin du domaine d'interet comparativement au premier protocole qui produit 
une empreinte ARN de ce domaine. 

Cette approche a ete realisSe sur ie modele grb2/grb33 decrit 
precedemment. L'ADN double brin de grb2 a ete produit par amplification 
PCR a partir de I'ADNc simple brin de grb2 et de deux amorces 
nucleotidiques correspondant a la sequence (1-22) de grb2 et £ la sequence 
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comptementaire de (618-639) de grb2. Ce fragment PCR a 6te purifte sur 
gel d'agarose, nettoye sur colonne d'affinrte (JetQuick, Genomed) et 
quantifie par spectrophotometrie. Dans le meme temps, deux ARNs 
synthetiques correspondant aux phases de lecture de grb2 et de grb33 ont 

5 ete produits a partir de vecteurs plasmidiques comportant les cDNAs de grb2 
ou de grt>33 sous controle du promoteur T7, a I'aide du kit RiboMax 
(Promega). Les ARNs ont ete purifies selon les instructions du foumisseur et 
nettoyes sur colomne d'exclusion (Sephadex G50, 5 prime-3 prime). 600 ng 
de I'ADN double brin de grb2 (1-639) ont ete associes avec : 

10 1. 3 fig d'ARN de grb33 

2. 3 jag d'ARN de grb2 

3. del'eau 

dans trois reactions differentes, dans le tampon suivant : 

100 mM PIPES (pH 7,2), 35 mM NaCI, 10 mM EDTA, 70% formamide 

is deionise (Sigma) 

Les echantillons ont ete amen6s a 56 °C puis refroidis a 44 °C 
par increment de -0,2 °C toutes les 10 minutes, lis sont ensuite conserves 3 
4 °C. L'analyse sur gel d'agarose revele des modifications de migrations 
dans les puits 1 et 2 par rapport au puits 3 controle (Figure 11 A) indiquant la 

20 formation de nouveaux complexes. Les echantillons sont ensuite traites au 
glyoxal deionise (Sigma) (5% v/v ou 1M) pendant 2 h a 12 °C. Les 
complexes sont ensuite precipites a l'6thanol (0,1 M NaCI, 2 volumes 
d'ethanol), laves a I'ethanol 70%, s6ches puis repris dans de I'eau. lis sont 
enfin traites par la RnaseH (Life Technologies), puis par une enzyme capable 

25 de degrader specifiquement I'ADN simple brin. La nuclease S1 et la 
nuclease u Mung Bean" presentent cette proprtete et sont disponibles 
commercialement (Life Technologies, Amersham). De telles digestions 
(incubations de 5 minutes dans les tampons fournis avec les enzymes) ont 
6te analysees sur gel d'agarose (figure 11B). Des digestions significatives 

30 sont uniquement obtenues a partir des complexes issus de la reaction 1 
(grb2/grb33) (figure 11B, puits 7 et 10). Ces digestions semblent plus 
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completes avec la nuclease S1 (puits 7) qu'avec la nuclease B Mung Bean " 
(puits 10). Ainsi, la bande correspondant a une taille legerement superieure a 
100 paires de bases (indiquee par une fleche dans le puits 7) a 6t§ puriftee, 
donee dans le vecteur pMos-Blue (Amersham), puis sequencee. Ce 
5 fragment correspond au domaine de 120 paires de bases de grb2, d6l6te 
dans grb33. 

Cette approche peut maintenant etre effectu6e a partir d'une 
population totale d'ARN messager et d'une population totale d'ADNc double 
brin produite selon les techniques connues de I'homme de metier. La 

10 population d'ARN de la situation de reference est hybridee a la population 
d'ADNc double brin de la situation test et reciproquement. Apres application 
du protocole d6crit ci-dessus t les digestions sont dSposees sur gel d'agarose 
afin d'isoler et de purifier les bandes correspondant a des tailles variant entre 
50 et 300 paires de bases. Ces bandes sont ensuite donees dans un 

is vecteur (pMos-Blue, Amersham) pour donner lieu a une banque d'inserts 
enrichis en des 6v§nements de differences qualitatives. 

3. CONSTRUCTION DE BANQUES ISSUES DE CRIBLAGES 
DIFFERENTIELS QUALITATIFS. 

20 

Les deux exemples decrits ci-dessus aboutissent aux clonages 
d'ADNc representatifs de toute ou partie des sequences epissees 
differentiellement entre deux situations physiopathologiques donnees. Ces 
ADNc permettent la constitution de banques par insertion de ces ADNc dans 

25 des vecteurs plasmidiques ou phagiques. Ces banques peuvent etre 
presentees sur des filtres de nitrocellulose ou tout autre support connu de 
I'homme de Tart, tels des chips ou biopuces ou membranes. Ces banques 
peuvent etre conservees au froid, a Fabri de la lumiere. Ces banques, une 
fois deposees et fixees sur support par les techniques classiques, peuvent 

30 etre traitees par des composes pour 6liminer les bacteries hotes qui 
permettent la production des plasmides ou des phages. Ces banques 
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peuvent egalement avantageusement etre constitutes de fragments cTADNc 
correspondant aux ADNc clones mais prepares par PCR de fa?on a ne 
deposer sur filtre que les sequences d6rivees des 6v6nements d'epissages 
alternatifs. 

5' L'une des caracteristiques et en meme temps Tune des 

originates du criblage differentiel qualitatif est que cette technique aboutit de 
fagon avantageuse non pas a une mais & deux banques differentielles ("paire 
de banque") qui represented I'ensemble des differences qualitatives qui 
existent entre deux situations donnees. En particulier, Tune des banques 

10 d'epissage differentiel de Pinvention represente la signature des qualites de 
la situation physiologique test par rapport a la situation physiologique de 
reference, et Pautre banque represente la signature des qualites de la 
situation physiologique de reference par rapport a la situation physiologique 
test. Ce couple de banques est egalement d6signe paire de banques ou 

15 "banque differentielle d^pissage". 

L'un des apports du criblage differentiel qualitatif etant de 
permettre d'evaluer le potentiel toxique d'un compose, comme cela est 
indique dans le chapitre suivant, un bon exemple de mise en ceuvre de la 
technologie est I'obtention par DATAS de clones d'ADNc correspondant a 

20 des sequences specifiques de cellules HepG2 naTves, d'une part, et traitees 
par de Tethanol, d'autre part. Ces cellules presentent des signes de 
cytotoxicite et une degradation de leur ADN par fragmentation 
internucleosomale a partir de 18h en presence de 1M d'6thanol. De fagon a 
obtenir des marqueurs pr6coces de la toxicite ethanolique, les ARN 

25 messagers ont ete prepares a partir de cellules naTves et de cellules traifees 
pendant 18h par de I'ethanol a la concentration de 0,1 M. Apres mise en 
oeuvre de la variante de DATAS qui utilise I'ADNc simple brin et la Rnase H, 
les ADNc clones obtenus ont ete amplifies par PCR, soumis a une 
electrophorese sur gel d'agarose et ensuite transfers sur un filtre de nylon 

30 selon les techniques connues de Thomme de Tart. Pour chaque ensemble de 
clones specifiques d'une part des differences qualitatives specifiques de 
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I'etat naif et d'autre part des sequences specifiques des cellules traitees par 
I'&hanol, deux repliques identiques de filtres sont effectuees. Ainsi les 
empreintes de chaque ensemble de clones sont hybrid6es d'une part avec 
une sonde specifique des cellules non traitees et d'autre part avec une 
5 sonde specifique des cellules traitees par 0,1 M d'ethanol pendant 18h. 

Le profil d'hybridation difterentiel obtenu et presente sur la figure 12 
permet d'apprecier la qualite de la soustraction effectuee lors de la mise en 
oeuvre de la technique DATAS. Ainsi les clones issus de ('hybridation de 
I'ARNm de cellules non traitees (NT) avec I'ADNc de cellules traitees (Tr) et 

10 qui doivent correspondre a des differences qualitatives specifiques de la 
situation naive hybrident preferentiellement avec une sonde representant la 
population totale des ARN messagers des cellules non traitees. 
Reciproquement, les clones issus des produits resistant a la RNase H ayant 
agi sur les heteroduplex ARN(Tr)/ADNc(NT) hybrident preferentiellement 

15 avec une sonde derivee de la population totale des ARN messagers des 
cellules traitees. 

Les deux ensembles de clones specifiques d'une part de la 
situation traitee et d'autre part de la situation non traitee represented un 
exemple de banques de differences qualitatives caracteristiques de deux 
20 6tats cellulaires distincts. 

4. UTILISATIONS ET APPORTS DES BANQUES DIFFERENTIELLES 
QUALITATIVES. 

25 Les possibilites d'utilisation des banques differentielles 

d'epissage de Tinvention sont illustrees notamment sur les Figures 13 a 15. 
Ainsi, ces banques sont utilisables pour : 

4.1 . USvaluation du potentiel toxique d ! un compose (figure 13) : 
30 Dans cet exemple, la situation de reference est designee A et la 

situation toxique est designee B. Des abaques de toxicite sont obtenues par 
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traitement de la situation A en presence de differentes concentrations d'un 
compose toxique de reference, pendant des periodes variables. A differents 
points les abaques de toxicite, des banques differentielles qualitatives sont 
constitutes (paires de banque), dans cet exemple, des banques restreintes 
rA/cB et rB/cA. Les paires de banque sont avantageusement deposees sur 
un support. Le support est ensuite hybride avec des sondes issues de 
Pechantillon biologique initial traite par differentes doses de composes test : 
Produits X, Y et Z. L'hybridation est rSvelee et fait apparaitre le potentiel 
toxique des produits test : dans cet exemple, le produit Z presente une forte 
toxicite et le produit Y offre un profil intermediate. La faisabilite de cette 
constitution d'abaques de toxicite est bien illustree par Texemple de 
constitution de banques de criblage differentiel qualitatif decrit ci-avant et 
mettant en jeu l'6thanol et des cellules HepG2. 

4.2. devaluation de Pefficacite d'une composition pharmaceutique 
(figure 14) : 

Dans cet exemple, une paire de banques restreintes selon 
Tinvention est realisee a partir d f un modele pathologique B et d'un modele 
sain A (ou du modele pathologique traite avec un produit actif de reference). 
Les banques differentielles rA/cB et rB/cA sont, le cas echeant, deposees sur 
un support. Cette paire de banque regroupe les differences d'epissage entre 
les deux situations. Cette paire de banque permet d'evaluer I'efficacite d'un 
compose test, c'est-a-dire de determiner sa capacite a generer un profil de 
type "sain" (rA/cB) a partir du profil de type pathologique (rB/cA). Dans cet 
exemple, la paire de banque est hybridee avec des sondes prepares a 
partir des situations A et B avec ou sans traitement par le compose test. Le 
profil d'hybridation qui peut etre obtenu est presente sur la figure 14. La 
faisabilite de cette application est la meme que celle de la constitution de 
banques de differences qualitatives caracteristiques de situations saines et 
toxiques presentee plus-haut. La situation toxique est rempiac6e par I'etat 
pathologique et il est possible d'apprecier la capacite d*un compose test a 
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produire une sonde hybridant avec plus ou moins de preference avec les 
situations de reference ou pathologique. 

4.3. L'anticipation de la reponse d'un echantillon pathologique a un 
5 traitement (figure 15) : 

Dans cet exemple, une paire de banque restreinte selon 
Tinvention est realisee a partir de deux modeles pathologiques, dont Tun 
repond a un traitement par un produit donne (le gene p53 sauvage par 
exemple) : situation A ; et I'autre y est refractaire : situation B. Cette paire de 
10 banque (rA/cB ; rB/cA) est deposee sur un support. 

Cette paire de banque est ensuite utilisee pour determiner la 
sensibility d'un echantillon pathologique test a ce meme produit. Pour cela, 
cette paire de banque est hybridee avec des sondes provenant de biopsies 
de patients dont on souhaite anticiper la reponse au traitement de reference. 
15 Le profil d'hybridation d'une biopsie de repondeur et d'une biopsie. de non- 
repondeur est presente sur la figure 15. 

4.4 [.'identification de ligands pour des recepteurs orphelins 

L'activation de recepteurs membranaires ou nucleaires par 

20 leurs ligands pourrait induire specifiquement des dysregulations dans 
Tepissage de certains ARNs. identification de ces evenements par les 
m6thodes DATAS de Tinvention permet de disposer d'un outil (marqueurs, 
banques, kits, etc.) de suivi d'activation de recepteurs, utilisables pour la 
recherche de ligands naturels ou synthetiques de recepteurs, en particulier 

25 orphelins. Selon cette application, des marqueurs associes aux 
dysregulations sont identifies et deposes sur des supports. L'ARN total de 
cellules, (sur)exprimant le recepteur a retude, traitees ou non par differentes 
compositions et/ou composes tests, est extrait et utilise comme sonde dans 
une hybridation avec les supports. La mise en evidence d'une hybridation 

30 avec certains, voire la totalite des marqueurs deposes sur le support, indique 
que le recepteur a retude a ete active, et done que le composition/compose 
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correspondant constitue ou comprend un ligand dudit recepteur. 

4.5 ^identification de cibles d'int£r§t th6rapeutique : 

Celle-ci se fait par identification de genes dont Tepissage est 
5 modifie dans une pathologie ou dans un modele de pathologie et plus 
precisement Identification des exons ou introns modifies. Cette approche 
doit permettre de donner acces aux sequences qui codent les domaines 
fonctionnels alteres lors de pathologies ou de tout phenomene 
physiopathologique adressant les ph£nomenes de proliferation, 

10 differentiation ou apoptose par exemple. 

Un exemple de I'apport du criblage differential qualitatif a 
I'identification de gdnes differentiellement episses est fourni par I'appiication 
de DATAS a un modele d'induction d'apoptose par induction de ('expression 
de la forme sauvage de p53. Ce modele cellulaire a ete etabli par 

is transfection d'un systeme d'expression inductible pour le gene suppresseur 
de tumeur p53. De fagon a identifier les differences quafitatives qui sont 
assoctes specifiquement a I'apoptose induite par p53, DATAS a 6te mise en 
ceuvre a partir des ARN messagers extraits de cellules induites et non 
induites. Pour ces experiences 200ng d'ARN polyA+ et 200ng d'ADNc ont 

20 6te utilises lors de la formation des heteroduplex. Une centaine de clones, a 
6te obtenue a partir de chacune des hybridations croisees. Uhybridation de 
ces clones bact6riens puis des fragments d'ADNc qu'ils contiennent avec 
des sondes representatives des ARN messagers totaux des situations de 
depart a permis I'identification de sequences specifiquement exprimees lors 

25 de la forte induction de p53 qui aboutit a la mort cellulaire (figure 16). 

Ces fragments derivent de sequences exoniques ou introniques qui 
modulent la quality du message present et permettent de proposer les 
domaines fonctionnels auxquels ils participent ou qulls interrompent comme 
des cibles d'intervention pour induire ou inhiber la mort cellulaire. 

30 Une telle approche aboutit 6galement a la constitution d'une paire de 

banques qui rassemblent des evenements differentiellement episses entre 
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une situation non apoptotique et une situation apoptotique. Cette paire de 
banque peut Stre utilisee pour tester le pouvoir hybridant d'une sonde 
deriv6e d'une autre situation physiopathologique ou d'un traitement 
particulier. Le resultat d'une telle hybridation donnera des indications sur 
5 I'engagement eventuel du programme d'expression g6n6tique de la situation 
testee vers I'apoptose. 

Comme il ressort de la description ci-avant, I'invention concerne 

egalement : 

10 - toute sonde nucleique, tout oligonucleotide, tout anticorps 

dirige contre une sequence identifiee par la technique decrite dans la 
presente demande et caracterises en ce qu'ils permettent de caracteriser 
une situation pathologique, 

- ['utilisation des informations issues de Tutilisation des 
15 techniques decrites pour la recherche de molecules organiques a vis6e 

therapeutique par la mise en place de criblages caracterises en ce qu'ils 
ciblent des domaines splices differentiellement entre une situation saine et 
une situation pathologique ou bien caracterises en ce qu'ils sont bases sur 
Tinhibition des gains de fonctions acquis par la proteine resultant d'un 
20 epissage differentiel, 

- I'utilisation des informations issues des techniques d6crites 
dans la presente demande pour des applications de therapie genique, 

- I'utilisation d'ADNc transfers par therapie genique 
caracterises en ce qu'ils ont des proprietes antagonistes ou agonistes sur 

25 des voies de signalisation cellulaires dgfinies, 

- toute constitution et toute utilisation de banques moleculaires 
d'exons ou d'introns altematifs a des fins: 

. de diagnostic ou de reactifs commerciaux pour la 

recherche 

30 . de cr6er ou de rechercher des molecules, polypeptides, 

acides nucleiques pour application th6rapeutique. 
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- toute constitution et toute utilisation de banques virtuelles 
informatiques regroupant des exons ou introns alternatifs caracterises en ce 
que ces banques permettent de concevoir des sondes nucleiques ou des 
amorces oligonucteotidiques dans le but de caracteriser les epissages 

5' alternatifs qui differentient deux 6tats physiopathologiques distincts. 

- toute composition pharmaceutique ou diagnostique 
comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables d'interferer avec les produits d'epissage 
alternatifs mis en evidence et clones par les techniques de I'invention, 

10 toute composition pharmaceutique ou diagnostique 

comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables de restaurer un epissage representatifs d'une 
situation normale par opposition a Pevenement alternatif caracteristique d'une 
situation pathologique. 

15 

5. DEREGULATIONS DES MECANISMES D'EPISSAGE DES ARNS 
PAR DES AGENTS TOXIQUES. 

Cet exemple montre que les differences de formes et/ou profils 
d'epissages peut etre utilisee comme marqueur pour le suivi et/ou la 
detection de toxicity et/ou d'efficacite de composes. 

Les effets d'agents toxiques sur les deregulations d'epissages des 
ARNs a ete teste de la maniere suivante. Des cellules h6patocytaires, 
HepG2, ont ete traitees par differentes doses de trois composes toxiques 
(ethanol, camptothecine, PMA (Phorbol 12-Myristate 13-Acetate)). Deux 
tests de cytotoxicity (Bleu de Trypan, MTT) ont ete realises a differents 
temps : 4h et 18h pour I'ethanol ; 4h et 18h pour la camptothecine ; 18h et 
40h pour le PMA. 

Le Bleu de Trypan est un colorant qui peut etre inco.rpore par les 
cellules vivantes. Un simple comptage des cellules "bleues" et "blanches" 
sous microscope permet de determiner le pourcentage de cellules vivantes 
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apres traitement .ou pourcentage de survie. Les points sont effectues en 
triplicates. 

Le test MTT est un test colorimetrique qui mesure ia capacity des 
cellules vivantes a convertir les sels solubles de tetrazolium (MTT) en un 
5 precipite insoluble de formazan. Ces cristaux de formazan, bleu fence, 
peuvent etre dissous et leur concentration determinee par mesure 
d'absorbance a 550 nm. Ainsi, apres ensemencement de plaques 24 puits 
par 150000 cellules sur la nuit, puis traitement des cellules par les composes 
toxiques, est ajoute 50 yl de MTT (Sigma) (a 5 mg/ml dans du PBS). La 

10 reaction de formation des cristaux de formazan s'effectue en 5 h dans 
Tincubateur a C02 (37°C, 5% C02, 95% humidite). Apres addition de 500 pi 
de solution de solubilisation (Hcl 0,1 N dans Isopropanol-Triton X-100 (10%)), 
les cristaux sont dissous sous agitation et les absorbances mesurees a 550 a 
660nm. Les points sont effectues en triplicates avec les controles (viabilite, 

15 mort cellulaire, blancs) appropries. 

Un test d'apoptose ou mort cellulaire programmee a §galement 6t6 
realise par mesure de la fragmentation d'ADN via 1'utilisation d'anticorps anti- 
histone et de mesures d'ELISA. Le test utilise est Cell Death ELISA Plus de 
Roche. 

20 Les resultats de ces trois tests (Figures 18 A,B,C) ont permis de 

determiner que les doses suivantes : 

• ethanol : 0,1 M 

• camptothecine : 1 Mg/ml 
25 • PMA : 50 ng/ml 

etaient bien inferieures aux IC50s mesurees. 

Les cellules HepG2 ont ainsi ete traitees par ces trois composes a ces 
trois doses pendant 4 h pour Tethanol et la camptothecine et 18 h pour le 
PMA. Les ARNs messagers ont 6te purifies par billes Dynal-Oligo-(dT) d 
30 partir d'ARNs totaux purifies selon le kit Rneasy (Quiagen). Des syntheses 
d'ADNc ont ete effectuees a partir de ces ARNs messagers et de la 
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Transcriptase Inverse Superscript (Life Technologies) en utilisant des 
hexameres aleatoires comme amorces. 

Ces premiers brins ont servi de matrices a des reactions 
d'amplification par PCR (94°C 1mn, 55°C 1mn, 72°C 1mn, 30 cycles) a I'aide 
5 des amorces oligonucleotidiques suivantes : 

MACH-a: 

5'-TGCCCAAATCAACAAGAGC-3' (SEQ ID NO: 11) 
10 5'-CCCCTGACAAGCCTGAATA-3' (SEQ ID NO: 12) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de MACH-a (1,2 et 3, amplifiant respectivement 595, 550 
et 343 paires de bases). MACH-a (Caspase-8) est une protease impliquee 
15 dans la mort cellulaire programmee (Boldin etal., Cell (1996), 85, 803-815). 

BCL-X : 

5' ATGTCTCAGAGCAACCGGGAGCTG 3' (SEQ ID NO: 13) 
20 5' GTGGCTCCATTCACCGCGGGGCTG 3* (SEQ ID NO: 14) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de bcl-X (bcl-XI, bcl-Xs, BCL-XB) (Boise et al., Cell (1993) 
74, 597-608; U72398 (Genbank)) et doivent amplifier un fragment unique 
25 pour ces trois isoformes de 204 paires de bases. 

FASR: 

5-TGCCAAGAAGGGAAGGAGT-3' (SEQ ID NO: 1 5) 
30 5'-TGTCATGACTCCAGCAATAG-3' (SEQ ID NO: 16) 
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Ces amorces correspondent a des regions communes a certaines 
isoformes de FASR et doivent amplifier un fragment de 478 paires de bases 
pour la forme sauvage de FasR, 452 pour Tisoforme A8 et 415 pour 
5 Tisoforme ATM. 

Les resultats rapport6s sur la figure 19 indiquent que : 

• la camptothecine induit une diminution de ('expression de Tisoforme 
MACH-a1 et une augmentation de Tisoforme MACH-a3. 

io • La camptothecine induit Tapparition d'une nouvelle isoforme de bcl-X 

(bande superieure du doublet migrant vers 200 paires de bases). 

• La camptothecine induit une diminution de fa forme sauvage du 
recepteur de fas, remplace par une expression d'une isoforme plus courte 
pouvant correspond re a Fas ATM. 

is • L'6thanol induit la disparition de bcl-x, remplace par une isoforme 

plus courte. 

• L'ethanol induit une augmentation de la forme longue, sauvage, du 
recepteur de fas, ceci aux depens de Tisoforme plus courte. 

20 Ces resultats demontrent que des traitements par des agents toxiques 

a des doses faibles peuvent induire des dysr6gulations d'epissages 
aiternatifs de certains ARNs, ceci de fagon specifique. ^identification de ces 
dysregulations au niveau post-transcriptionnel, notamment par Tapplication 
de la technologie DATAS permet ainsi de definir un outil predictif de la 

25 toxicite de molecules. 
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REVENDICATIONS 

1. Procede d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences gEnetiques qualitatives entre deux 
5 Echantillons biologiques, comprenant une 6tape d'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'un premier Echantillon 
biologique avec une population d'ADNc provenant d'un deuxieme echantillon 
biologique. 

10 2. Procede selon la revendication 1 caracterise en ce qu'il comprend : 

(a) Thybridation des ARN provenant du premier echantillon 
(situation test) avec les ADNc provenant du deuxieme Echantillon (situation 
de reference); 

(b) Thybridation des ARN provenant du deuxieme Echantillon 
is (situation de reference) avec les ADNc provenant du premier echantillon 

(situation test); et 

(c) ^identification et/ou le clonage, a partir des hybrides formes 
en (a) et (b), d'acides nuclEiques correspondant a des differences genEtiques 
qualitatives. 

20 

3. Procede selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont realisees entre une population d'ARN et des ADNc simple- 
brins et en ce qu'il comprend I'identification et/ou le clonage de regions 
d'ARN non appariees. 

25 

4. Procede selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont rEalisees entre une population d'ARN et des ADNc double- 
brins et en ce qu'il comprend Identification et/ou le clonage de regions 
d'ADN appariees. 

30 

5. Procede selon la revendication 1 caracterise en ce qu'il comprend 
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Phybridation entre une population d'ADNc double-brin provenant d'un premier 
6chantillon biologique et une population d'ADNc simple-brin provenant d'un 
deuxteme echantillon biologique. 

5 6. Procede selon Tune des revendications 1 a 5 caracterise en ce que 

Pechantillon biologique est compose de cellules, d'un tissu, d'un organe ou 
d'une biopsie. 

7. Procede selon Tune des revendications 1 a 6 pour Identification 
io et/ou le clonage d'epissages altematifs differentiels entre des cellules 

tumorales et des cellules non-tumorales. 

8. Procede selon Tune des revendications 1 a 6 pour ('identification 
et/ou le clonage d'epissages altematifs differentiels entre des cellules traitees 

is par un compose test et des cellules non-trait6es. 

9. Proc§d6 selon I'une des revendications 1 a 6 pour Identification 
et/ou le clonage d'epissages altematifs differentiels entre des cellules en 
apoptose et des cellules non-apoptotiques. 

20 

10. ProcSde selon I'une des revendications 1 a 9 caracterise en ce 
que ['hybridation est realisee en phase liquide. 

11. Procede d'identification et/ou de clonage de regions d'acides 
25 nucleiques epissees differentiellement entre deux situations physiologiques A 

et B, comprenant : 

(a) la formation d'heteroduplex en phase liquide entre les ARN 
messagers provenant de la situation A et les ADNc provenant de la situation 
B d'une part; 

30 (b) la formation d'heteroduplex en phase liquide entre les ARN 

messagers provenant de la situation B et les ADNc provenant de la situation 
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A d'autre part; et 

(c) Tidentification et/ou le clonage des regions d'ARN non 
appariees dans les heteroduplex obtenus en (a) et en (b). 

5" .12. Precede d'identification et/ou de clonage de regions d'acides 
nucleiques 6pissees differentiellement entre deux situations physiologiques A 
et B, comprenant : 

(a) la formation d'heteroduplex entre les ARN messagers 
provenant de la situation A et les ADNc provenant de la situation B d'une 

10 part, les ARN ou les ADNc etant immobilises sur un support ; 

(b) la formation d'heteroduplex entre les ARN messagers 
provenant de la situation B et les ADNc provenant de la situation A d'autre 
part, les ARN ou les ADNc etant immobilises sur un support ; et 

(c) Tidentification et/ou le clonage des regions d'ARN non 
is appariees dans les heteroduplex obtenus en (a) et en (b). 

13. Composition comprenant les acides nucleiques identifies et/ou 
clones selon les procedes des revendications 1 a 12. 

20 14. Composition d'acides nucleiques, caracterisee en ce qu'elle 

comprend essentiellement les acides nucleiques representatifs d'alterations 
genetiques qualitatives, notamment des epissages alternatifs distinguant 
deux situations physiologiques d'une cellule ou d'un tissu. 

25 15. Composition selon les revendications 13 ou 14 caracterisee en ce 

que les acides nucleiques sont clones dans des vecteurs. 

16. Banque d'acides nucleiques comprenant des acides nucleiques 
specifiques d'alterations gen6tiques qualitatives, notamment d'epissages 
30 alternatifs distinguant deux situations physiologiques d'une cellule ou d'un 
tissu. 
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17. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque restreinte aux epissages alternatifs qui caracterisent les ARN 
matures. 

5 

18. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque complexe des epissages alternatifs qui caracterisent les 
transcrits. 

10 19. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 

d'une banque autologue caracteristique des epissages alternatifs entre les 
ARN matures et premessagers d'une situation physiologique. 

20. Banque decides nucleiques comprenant des oligonucleotides ou 
15 des fragments PCR specifiques d'epissages alternatifs distinguant deux 

situations physiologiques. 

21. Banque de microorganismes comprenant des microorganismes 
transformes par des acides nucleiques specifiques d'epissages alternatifs 

20 distinguant deux situations physiologiques d'une cellule ou d'un tissu. 

22. Banque selon les revendications 16 a 21 caract§ris6e en ce qu'elle 
est depos6e sur un support. 

25 23. Kit comprenant un support sur lequel est depose une banque 

selon Tune des revendications 16 & 21. 

24. Kit selon la revendication 23 caracterise en ce qu'il comprend deux 
banques selon Tune des revendications 16 a 21, deposee sur un meme 
30 support ou sur deux supports distincts. 
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25. Kit selon les revendications 23 ou 24 caracterise en ce que le 
support est compose d'un filtre, membrane ou d'une puce. 

26. Utilisation d'une composition selon Tune des revendications 13 a 
5 15 ou d'une banque selon les revendications 16 a 21 pour I'identification de 

molecules actives. 

27. Utilisation d'une composition selon Tune des revendications 13 a 
15 ou d'une banque selon les revendications 16 a 21 pour ('identification de 

10 prolines ou domaines proteiques affectes dans une pathologie. 

28. Utilisation d'une composition selon I'une des revendications 13 a 
15 ou d'une banque selon les revendications 16 £ 21 pour Tidentification de 
domaines antigeniques specifiques de proteines impliquees dans une 
pathologie. 

29. Methode d'identification et/ou de production de proteines ou 
domaines proteiques impliquSs dans une pathologie comprenant : 

(a) ('hybridation des ARN messagers d'un echantillon 
pathologique avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux 
en parallele, 

(b) ('identification, dans des hybrides formes, des regions 
correspondent aux differences qualitatives specifiques de P6tat pathologique 
par rapport a I'6tat sain, 

(c) ('identification et/ou la production d'une proteine ou domaine 
proteique correspondant a une region identifiee en (b). 

30. Procede d'identification et/ou de clonage de genes suppresseurs 
de tumeurs ou d'epissages au sein de genes suppresseurs de tumeurs, 
comprenant : 

(a) Phybridation des ARN messagers d'un echantillon de tumeur 
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avec les ADNc d'un Echantillon sain, ou I'inverse, ou les deux en parallele, 

(b) 1'identification, dans les hybrides form6s, des regions 
correspondant aux differences qualitatives specifiques de I'echantillon 
tumoral par rapport a I'etat sain, 
5 (c) Tidentification et/ou la production d'une proline ou domaine 

proteique correspondant a une region identifiee en (b). 

31. Composition comprenant un compose capable d'interferer avec les 
produits d'epissages alternatifs identifies selon le precede des revendications 

10 1 a 12. 

32. Proteine susceptible d'etre identifiee par le procede de la 
revendication 29. 

15 33. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 

kit selon les revendications 23 a 25 pour evaluer la toxicite d'un compose. 

34. Procede d'identification et/ou de clonage d'acides nucleiques 
specifique d'un etat toxique d'un Echantillon biologique donne comprenant la 
20 preparation de banques differentiates qualitatives entre les ARN et les ADNc 
de I'echantillon apres ou sans traitement par un compose toxique test, et la 
recherche de marqueurs de toxicite specifiques des qualites de I'echantillon 
apres traitement. 

25 35. Procede de determination ou d'evaluation de la toxicite d'un 

compose test sur un echantillon biologique donne comprenant I'hybridation : 

- de banques differentiates entre les ADNc et les ARN dudit 
echantillon biologique d l'6tat sain et a un ou differents stades de toxicite 
resultant d'un traitement dudit echantillon avec un compose toxique de 

30 reference, avec, 

- une preparation d'acides nucleiques de I'echantillon biologique 
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traite par ledit compose test, et 

- revaluation du potentiel toxique du compose test par analyse 
du degre d'hybridation avec les differentes banques. 

5 36. Proc6d6 selon la revendication 35 caracterise en ce que 

I'echantillon biologique est une culture d'hepatocytes, de cellules epitheliales 
renales ou de cellules endothelials, traitee ou non par un agent toxique, de 
preference I'ethanol. 

37. Procede selon la revendication 35 caracteris6 en ce que 
I'echantillon biologique est une culture de peau traitee ou non par des agents 
toxiques ou irritants. 

38. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
kit selon les revendications 23 a 25 pour evaluer I'efficacite d'un compost. 

39. Procede de determination ou devaluation de I'efficacite 
therapeutique d'un compose test sur un echantillon biologique donne 
comprenant I'hybridation : 

- de banques differentiates entre les ADNc et les ARN dudit 
echantillon biologique a I'etat sain et a I'etat pathologique avec, 

- une preparation d'acides nucleiques de I'echantillon biologique 
traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
analyse du degre d'hybridation avec les differentes banques. 

40. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
kit selon les revendications 23 a 25 pour evaluer la reponse d'un echantillon 
pathologique a un compose. 

41. Proc6de de determination ou devaluation de la reponse d'un 
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patient a un compose ou traitement test comprenant rhybridation : 

- de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-r6pondeur ou mal-repondeur audit 

5 compose/traitement, avec, 

- une preparation d'acides nucleiques d'un echantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

10 

42. Procede selon la revendication 41 pour la determination ou 
revaluation de la reponse d'un patient a un compose ou traitement 
antitumoral. 

15 43. Procede selon la revendication 42 pour la determination ou 

revaluation de la reponse d'un patient a un traitement antitumoral par 
transfert du gene p53 sauvage. 

44. Acide nucleique susceptible d'etre identifie par le procede selon 
20 les revendications 1 a 12. 

45. Utilisation d'un acide nucleique selon la revendication 44 pour la 
detection d'anomalies genetiques dans un echantillon. 

25 46. Utilisation d'un compose selon la revendication 28 pour la 

detection d'une anomalie g§n§tique dans un echantillon. 

47. Anticorps dirig§ contre une proteine ou un domaine proteique tel 
que defini dans la revendication 27 ou 28. 

30 

48. Proteine ASHC de sequence SEQ ID NO: 9. 
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49. Sonde nucleique, oligonucleotide ou anticorps permettant d'identifier la 
proteine ASHC selon ia revendication 48 ou son acide nucleique, et/ou une 
alteration du rapport SHC/ASHC dans un echantillon biologique. 

5' 

50. Proc6d6 de criblage caracterise en ce qu'il est base sur le blocage du 
domaine episse dans la proteine SHC ou sur le blocage des gains de fonction 
acquis par la proteine epissee A SHC. 

10 51. Vecteur comprenant une sequence codant pour la proteine ASHC 

selon la revendication 48. 

52. Procede selon les revendications 3, 4 ou 5 caracterise en ce que 
le clonage des acides nucleiques comprend la transcription inverse et/ou 

is ramplification au moyen d'amorces aleatoires ou semi-aleatoires, en 
particulier d'amorces de sequence SEQ ID NO: 3 dans laquelle N indique 
que chacune des quatre bases peut etre presente de fa$on aleatoire a la 
position indiquee, W, X et Y designent chacun une base determinee, et Z 
designe soit une base determinee, soit un groupe 3-OH. 

20 

53. Oligonucleotide comprenant, dans I'orientation 5' — > 3' : 

- une zone stabilisatrice comprenant 8 a 24 nucleotides determines, 

- une region al6atoire comprenant de 3 a 8 nucleotides, et 

- une zone minimale d'amorgage comprenant 2 a 4 nucleotides 
25 d6finis. 

54. Oligonucleotide de sequence SEQ ID NO: 3 dans laquelle : 

- N indique que chacune des quatre bases peut etre presente 
de fagon aleatoire 3 la position indiqu6e; 

- W, X et Y designent chacun une base d6termin§e, 

30 - Z designe soit une base determinee, soit un groupe 3-OH. 
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55. Banque d'ADN gtnomique caracttriste en ce qu'elle est 
constitute de fragments d'ADN genomiques de faille inftrieure ou tgale £ 1 
kb environ. 

56. Methode de detection ou de suivi du potentiel toxique et/ou 
therapeutique d'un compost, basee sur ia detection de formes et/ou de 
profits d'epissages induits par ce compost sur un tchantillon biologique. 

57. Utilisation, comme source de marqueurs de pharmacogenomique, 
(i) de Tintervariabilite, entre individus, d'isoformes gentrees par tpissage 
alternatif (analyse du spliceome) ou (ii) de modifications d'epissage induites 
par des traitements. 
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ECHANTILLON 1 ECHANTILLON 2 




hybridation 

1 . -> Heteroduplexes ARN/ADNc sb 

2. -> Heterotriplexes ARN/ADNc db 

3,4. -> HOMODUPLEXESADN/ADN 
FIGURE 1A 
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ECHANTILLON TEST 
(B) 



ECHANTILLON REFERENCE 
(A) 



ARN 



ARN 




ADNC 



ARN (B)/ ADNC (A) 



POPULATION 
D'ACIDES NUCLEIQUES CARACTERISTIQUES 
DE SITUATION (B) PAR RAPPORT A SITUATION (A) 



FIGURE 1B 
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ECHANTILLON TEST 
(B) 



ARN (B) 



ADNc (B) 



ECHANTILLON REFERENCE 
(A) 




ARN (A) 



ADNC (A) 



HYBRIDATION HYBRIDATION 



ARN (A) / ADNc (B) ARN (B) / ADNc (A) 



POPULATION 2 

acides nucteiques 
caracteristiques des 
differences qualitatves 
de (a) par rapport a (b) 



POPULATION 1 

acides nucleiques 
caracteristiques des 
differences qualitatives 
de (b) par rapport a (a) 



FIGURE 1C 
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FIGURE ID 
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ARN(mA) 
Echantillon pathologique 



ARN(mB) 
Echantillon normal 



c 
A 



ADN comptementaire 

cB 




I 



Hybrides ARN^ / cDNA„ ormal (mA/cB) 
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Hybrides ARN pfl „„ / cDNA normal 



Sequence non epissee apres digestion £ la RNaseH 



i 

Sequence recherchee marquee en 5 f et 3* 
a Taide de deux oligonucleotides 



fTTTE = = = = 

I 

Fragment amplifie par PCR 




Clonage ct sequcncage 
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RNA (mA) RNA (mB) 

Echantillon normal Echantillon pathologique 



I 

synthese des ler et 2eme brins d'ADNc jlsA etifc) 



Hybridation du double brin(J^ avec 
TARN mB en presence de formamide 



R-loop 



+ glyoxal 




- formamide 
RNaseH, 



E1GHEE-5 



Mung Bean nuclease 
s 1 nuclease 
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B Situations A et B 

ARNm 



ler brins d 'ADNc 
de A et de B 



2eme brin d ' ADNc de A 




Hybridations des 2 brins 
de A avec le ler brin de B 



Digestion par Sau3AI 



Separation des boucles engagees en duplex 



Adjonction de linkers aux sites Sau3AI 



Amplification par PCR puis clonage 

pr.URE 6A 
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Exons ou introns alternatif de la situation A 

et de ia situation B 



1 





Sequences de jonction 



Sequences flanquantes 



FIGURE 6B 
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I 



Pathologie m Diagnostics 



Target for —4 cDNA pour 

7 Therapie 
Therapeutic Intervention Genique 



Criblage haut flux 




Candidat f Profil Toxicologique 

(genotoxicite) 

Signature d'efficacite 
Drogue f (genopharmacologie) 
Mecanisme d'action 



1 



Pharmacogenomique 



FTCIIRE 7 
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FEUILLE DE REMPLACEMENT (REGLE 26) 
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FEUiLLE DE ^EMPLACEMENT (REGLE 26) 
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12 34 5 6 7 89 10 1112 13 




Figure 10 



FEUIULE DE ^EMPLACEMENT (REGLE 26) 
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A) 

1 2 3 



600 
500 
400 




B) 



1 2 3 4 5 6 7 8 9 10 11 12 




Figure 1 1 

FEUSLLE DE REMFLACEMENT (REGLE 26} 
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FEUILLE DE REMPLACEMENT (REGLE 26) 
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B 



Construction de banques differentielles qualitatives a difie rents points 
des abaques de toxicite 



Paire de Banques 



rB/cA 
rA/cB 




Hybridation avec des sondes issues du raodele initial 



t 


raite par differents produits 




produitX QQ 


00 


00 


00 


produitY Q0 


00 


00 


00 


produitZ \jJ\J 


00 


00 


00 



FIGURE 13 
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rA/cB 



Support 




rB/cA 



HYBRIDATION 



sans produit : 



sonde A 





sonde B 



avec produit efficace: 



sonde A 



sonde B 

FIGURE 14 








o 
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Support 



/ 0 °\ 


r~ 


fo° 0 ° J 




\°°o 0 J 


© 


rA/cB 


rB/cA 




HYBRIDATION 




r 



biopsie de repondeurs: 




biopsies de non repondeurs: 




FIGURE ?g 
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FEUILLE DE REMPLACEMENT (REGLE 26) 
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Sequence peptidique de ASHC (SEQ ID NO: 9) 

l 

MNKLSGGGGR RTRVEGGQLG GEEWTRHGSF VNKPTRGWLH PNDKVMGPGV 
SYLVRYMGCV EVLQSMRALD FNTRTQVTRE AISLVCEAVP GAKGATRRRK 
PCSRPLSSIL GRSNLKFAGM PITLTVSTSS LNLMAADCKQ IIANHHMQSI 
SFASGGDPDT AEYVAYVAKD PVNQRACHIL ECPEGLAQDV ISTIGQAFEL 
RFKQYLRNPP KLVTPHDRMA GFDGSAWDEE EEEPPDHQYY NDFPGKEPPL 
GGWDMRLRE GAAPGAARPT APNAQTPSHL GATLPVGQPV GGDPEVRKQM 
PPPPPCPGRE LFDDPSYVNV QNLDKARQAV GGAGPPNPAI NGSAPRDLFD 
MKPFEDALRV PPPPQSVSMA EQLRGEPWFH GKLSRREAEA LLQLNGDFLV 
RTKDHRFESV SHLISYHMDN HLPIISAGSE LCLQQPVERKL 

441 



Sequence nucleique de ASHC (SEQ ID NO: 10) 



atgaacaagc 


tgagtggagg 


cggcgggcgc 


aggactcggg 


tggaaggggg 


50 


ccagcttggg 


ggcgaggagt 


ggacccgcca 


cgggagcttt 


gtcaataagc 


100 


ccacgcgggg 


ctggctgcat 


cccaacgaca 


aagtcatggg 


acccggggtt 


150 


tcctacttgg 


ttcggtacat 


gggttgtgtg 


gaggtcctcc 


agtcaatgcg 


200 


tgccctggac 


ttcaacaccc 


ggactcaggt 


caccagggag 


gccatcagtc 


250 


tggtgtgtga 


ggctgtgccg 


ggtgctaagg 


gggcgacaag 


gaggagaaag 


300 


ccctgtagcc 


gcccgctcag 


ctctatcctg 


gggaggagta 


acctgaaatt 


350 


tgctggaatg 


ccaatcactc 


tcaccgtctc 


caccagcagc 


ctcaacctca 


400 


tggccgcaga 


ctgcaaacag 


atcatcgcca 


accaccacat 


gcaatctatc 


450 


tcatttgcat 


ccggcgggga 


tccggacaca 


gccgagtatg 


tcgcctatgt 


500 


tgccaaagac 


cctgtgaatc 


agagagcctg 


ccacattctg 


gagtgtcccg 


550 


aagggcttgc 


ccaggatgtc 


atcagcacca 


ttggccaggc 


cttcgagttg 


600 


cgcttcaaac 


aatacctcag 


gaacccaccc 


aaactggtca 


cccctcatga 


650 


caggatggct 


ggctttgatg 


gctcagcatg 


ggatgaggag 


gaggaagagc 


700 


cacctgacca 


tcagtactat 


aatgacttcc 


cggggaagga 


accccccttg 


750 


gggggggtgg 


tagacatgag 


gcttcgggaa 


ggagccgctc 


caggggctgc 


800 


tcgacccact 


gcacccaatg 


cccagacccc 


cagccacttg 


ggagctacat 


850 


tgcctgtagg 


acagcctgtt 


gggggagatc 


cagaagtccg 


caaacagatg 


900 



FIGURE 17A 
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ccacctccac caccctgtcc aggcagagag ctttttgatg atccctccta 950 
tgtcaacgtc cagaacctag acaaggcccg gcaagcagtg ggtggtgctg 1000 
ggccccccaa tcctgctatc aatggcagtg caccccggga cctgtttgac 1050 
atgaagccct tcgaagatgc tcttcgggtg cctccacctc cccagtcggt 1100 
gtccatggct gagcagctcc gaggggagcc ctggttccat gggaagctga 1150 
gccggcggga ggctgaggca ctgctgcagc tcaatgggga cttcttggtt 1200 
cggactaagg atcaccgctt tgaaagtgtc agtcacctta tcagctacca 1250 
catggacaat cacttgccca tcatctctgc gggcagcgaa ctgtgtctac 1300 
agcaacctgt ggagcggaaa ctgtga 1326 
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Bleu Trypan HepG2 / Ethanol 



% cellules vivantes 

100 r- 




Test MTT 



% cellules vivantes 




FIGURE 18A 



Test ELISA de fragmentation de I'ADN 



Facteur d'enrichissement 

20 




I 4h 



0 0.01 0.1 1 M 
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Bleu Trypan 



HepG2 / Camptothecin 



% cellules vivantes 

100 




ft 



4h 



18h 



0 0.01 0.1 1 10 20 Hg/ml 



Test MTT 



% cellules vivantes 




|4h 

i18h 

^ir.TIRF 18B 



0 0.01 0.1 1 10 20 

Test ELISA de fragmentation de I'ADN 

Facteur d'enrichissement 



Hg/ml 



8 




4h 



0 0.01 0.1 1 10 ttg/ml 
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Bleu Trypan 
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HepG2 / PMA 



cellules vivantes 




Test WITT 



% cellules vivantes 




|18h 
,40h 



0 0.01 0.05 0.5 5 . 50 ^ /ml 



Test ELISA de fragmentation de I'ADN 

Facteur d'enrichissement 



FIGURF t»r- 




18h 



0 0.01 0.05 0.5 5 50 (jg/ml 
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FEUiLLE DE REMPLACE&SENT (REGLE 26) 
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LISTE DE SEQUENCES 

<110> EXONHIT THERAPEUTICS SA 

<120> CRIBLAGE DIFFERENTIEL QUALITATIF 

<130> B3898B - PB/KM 

<140> 
<141> 

<150> 9802997 
<151> 1998-03-11 

<160> 16 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 1 

gagaagcgtt atnnnnnnna ggn 23 

<210> 2 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 2 

gagaagcgtt atnnnnnnnn tccc 24 

<210> 3 
<211> 23 
<212> ADN 

<213> Sequence artificielle 



<220> 
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<223> Description de la sequence artif icielle : OLIGO 
<400> 3 

gagaagcgtt atnnnnnnnn nnn 23 

<210> 4 
<211> 20 
<212> ADN 

<213> Sequence artif icielle 



<220> 

<223> Description de la sequence artif icielle : OLIGO 
<400> 4 

gagaagcgtt atnnnnncca 20 

<210> 5 

<211> 66 

<212> ADN 

<213> Homo sapiens 



<400> 5 

ccacacctgg ccagtatgtg ctcactggct tgcagagtgg gcagccagcc taagcatttg 60 
cactgg 66 



<210> 6 
<211> 23 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: OLIGO 



<400> 6 

gggacctgtt tgacatgaag ccc 23 

<210> 7 
<211> 22 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: OLIGO 



<400> 7 

cagtttccgc tccacaggtt gc 



22 
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<210> 8 

<211> 96 

<212> ADN 

<213> Homo sapiens 



<400> 8 

gtacgggaga gcacgaccac acctggccag tatgtgctca ctggcttgca gagtgggcag 60 
cctaagcatt tgctactggt ggaccctgag ggtgtg 96 

<210> 9 

<211> 441 

<212> PRT 

<213> Homo sapiens 



<400> 9 

Met Asn Lys Leu Ser Gly Gly Gly Gly Arg Arg Thr Arg Val Glu Gly 
1.5 10 15 

Gly Gin Leu Gly Gly Glu Glu Trp Thr Arg His Gly Ser Phe Val Asn 
20 25 30 

Lys Pro Thr Arg Gly Trp Leu His Pro Asn Asp Lys Val Met Gly Pro 
35 40 45 

Gly Val Ser Tyr Leu Val Arg Tyr Met Gly Cys Val Glu Val Leu Gin 
50 55 60 

Ser Met Arg Ala Leu Asp Phe Asn Thr Arg Thr Gin Val Thr Arg Glu 
65 70 75 80 

Ala lie Ser Leu Val Cys Glu Ala Val Pro Gly Ala Lys Gly Ala Thr 
85 90 95 

Arg Arg Arg Lys Pro Cys Ser Arg Pro Leu Ser Ser He Leu Gly Arg 
100 105 110 

Ser Asn Leu Lys Phe Ala Gly Met Pro He Thr Leu Thr Val Ser Thr 
115 120 125 

Ser Ser Leu Asn Leu Met Ala Ala Asp Cys Lys Gin He He Ala Asn 
130 135 140 

His His Met Gin Ser He Ser Phe Ala Ser Gly Gly Asp Pro Asp Thr 
145 150 155 160 

Ala Glu Tyr Val Ala Tyr Val Ala Lys Asp Pro Val Asn Gin Arg Ala 
165 170 175 

Cys His He Leu Glu Cys Pro Glu Gly Leu Ala Gin Asp Val He Ser 
180 185 " 190 



Thr He Gly Gin Ala Phe Glu Leu Arg Phe Lys Gin Tyr Leu Arg Asn 
195 200 * 205 
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Pro Pro Lys Leu Val Thr Pro His Asp Arg Met Ala Gly Phe Asp Gly 
210 215 220 

Ser Ala Trp Asp Glu Glu Glu Glu Glu Pro Pro Asp His Gin Tyr Tyr 
225 230 235 240 

Asn Asp Phe Pro Gly Lys Glu Pro Pro Leu Gly Gly Val Val Asp Met 
245 250 255 

Arg Leu Arg Glu Gly Ala Ala Pro Gly Ala Ala Arg Pro Thr Ala Pro 
260 265 270 

Asn Ala Gin Thr Pro Ser His Leu Gly Ala Thr Leu Pro Val Gly Gin 
275 280 285 

Pro Val Gly Gly Asp Pro Glu Val Arg Lys Gin Met Pro Pro Pro Pro 
290 295 300 

Pro Cys Pro Gly Arg Glu Leu Phe Asp Asp Pro Ser Tyr Val Asn Val 
305 310 315 320 

Gin Asn Leu Asp Lys Ala Arg Gin Ala Val Gly Gly Ala Gly Pro Pro 
325 330 335 

Asn Pro Ala lie Asn Gly Ser Ala Pro Arg Asp Leu Phe Asp Met Lys 
340 345 350 

Pro Phe Glu Asp Ala Leu Arg Val Pro Pro Pro Pro Gin Ser Val Ser 
355 360 365 

Met Ala Glu Gin Leu Arg Gly Glu Pro Trp Phe His Gly Lys Leu Ser 
370 375 380 

Arg Arg Glu Ala Glu Ala Leu Leu Gin Leu Asn Gly Asp Phe Leu Val 
385 390 395 400 

Arg Thr Lys Asp His Arg Phe Glu Ser Val Ser His Leu lie Ser Tyr 
405 410 415 

His Met Asp Asn His Leu Pro lie lie Ser Ala Gly Ser Glu Leu Cys 
420 425 430 

Leu Gin Gin Pro Val Glu Arg Lys Leu 
435 440 

<210> 10 

<211> 1326 

<212> ADN 

<213> Homo sapiens 



<400> 10 

atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg ccagcttggg 60 
ggcgaggagt ggacccgcca cgggagcttt gtcaataagc ccacgcgggg ctggctgcat 120 
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cccaacgaca aagtcatggg acccggggtt tcctacttgg ttcggtacat gggttgtgtg 180 
gaggtcctcc agtcaatgcg tgccctggac ttcaacaccc ggactcaggt caccagggag 240 
gccatcagtc tggtgtgtga ggctgtgccg ggtgctaagg gggcgacaag gaggagaaag 300 
ccctgtagcc gcccgctcag ctctatcctg gggaggagta acctgaaatt tgctggaatg 360 
ccaatcactc tcaccgtctc caccagcagc ctcaacctca tggccgcaga ctgcaaacag 420 
atcatcgcca accaccacat gcaatctatc tcatttgcat ccggcgggga tccggacaca 480 
gccgagtatg tcgcctatgt tgccaaagac cctgtgaatc agagagcctg ccacattctg 540 
gagtgtcccg aagggcttgc ccaggatgtc atcagcacca ttggccaggc cttcgagttg 600 
cgcttcaaac aatacctcag gaacccaccc aaactggtca cccctcatga caggatggct 660 
ggctttgatg gctcagcatg ggatgaggag gaggaagagc cacctgacca tcagtactat 720 
aatgacttcc cggggaagga accccccttg gggggggtgg tagacatgag gcttcgggaa 780 
ggagccgctc caggggctgc tcgacccact gcacccaatg cccagacccc cagccacttg 84 0 
ggagctacat tgcctgtagg acagcctgtt gggggagatc cagaagtccg caaacagatg 900 
ccacctccac caccctgtcc aggcagagag ctttttgatg atccctccta tgtcaacgtc 960 
cagaacctag acaaggcccg gcaagcagtg ggtggtgctg ggccccccaa tcctgctatc 1020 
aatggcagtg caccccggga cctgtttgac atgaagccct tcgaagatgc tcttcgggtg 1080 
cctccacctc cccagtcggt gtccatggct gagcagctcc gaggggagcc ctggttccat 1140 
gggaagctga gccggcggga ggctgaggca ctgctgcagc tcaatgggga cttcttggtt 1200 
cggactaagg atcaccgctt tgaaagtgtc agtcacctta tcagctacca catggacaat 1260 
cacttgccca tcatctctgc gggcagcgaa ctgtgtctac agcaacctgt ggagcggaaa 1320 
ctgtga 1326 

<210> 11 
<211> 19 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : OLIGO 
<400> 11 

tgcccaaatc aacaagagc 19 

<210> 12 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 12 

cccctgacaa gcctgaata 19 



<210> 13 
<211> 24 
<212> ADN 



WO 99/46403 



PCT/FR99/00547 



6 



<213> Sequence artificielle 



<220> 

<223> Description de la s6quence artificielle: OLIGO 



<400> 13 



atgtctcaga gcaaccggga gctg 



24 



<210> 14 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 14 

gtggctccat tcaccgcggg gctg 24 

<210> 15 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 



<210> 16 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 



<400> 15 



tgccaagaag ggaaggagt 



19 



<400> 16 

tgtcatgact ccagcaatag 



20 
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38-43 




and localisation of UBE2L4, a novel member 






of a ubiquitin conjugating enzyme 






dispersed gene family" 






CYTOGENETICS AND CELL GENETICS, 






vol. 79, 1997, pages 188-192, XP002087173 






voir abrege 






voir page 188, colonne 1, allnea 1 - page 






190 colonne 1 alinea 1* fiaure 1 
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y 


BONASS W A ET AL.: "The rat amelogenin 
gene - some aspects of evolution and 
expression" 

ADVANCES IN DENTAL RESEARCH, 

vol. 10, no. 2, 1996, pages 182-186, 

ypnn?nfi7i 7& 

ArUUcUO/ I IH 

voir le document en entler 


16-28, 
33-35, 
38-43 


Y 


WO 94 12631 A (ISIS INNOVATION ;TARIN 
DAVID (GB); MATSUMURA YASUHIRO (GB)) 
9 juin 1994 

voir le document en entler 


1,5-8, 
13-15, 
26-28, 

AA — Al 

44 ~4/ 


Y 


WO 97 46679 A (ST JUDE CHILDRENS RES 
HOSPITAL) 11 decembre 1997 

voir abrege; revendications 1-32 


1,5-8, 
10-15, 

39,44,47 


Y 


EP 0 806 478 A (HEALTH RESEARCH INC) 
12 novembre 1997 

voir le document en entier 


1,7,30, 
42,43, 

AC AC 


Y 


WO 96 30512 A (RHONE POULENC RORER SA 
;BRACCO LAURENT (FR); SCHWEIGHOFFER 
FABIEN) 3 octobre 1996 

voir le document en entier 


1,11-16, 

20,23, 

26-32, 

00-41 , 44 


Y 


US 5 679 541 A (LEISERS0N WILLIAM M ET 
AL) 21 octobre 1997 

voir abrege 

voir colonne 21, ligne 9 - llgne 36 


1,5,6,9, 
16, 


Y 


W0 97 04092 A (RHONE POULENC RORER SA 
;C0NSEILLER EMMANUEL (FR); BRACC0 LAURENT 
() 6 fevrier 1997 
voir abrege; revendications 1-53 


1,5-10, 

30,42, 

43,45,46 


V 

f 


piilllk k u nnu KiBLti k: improved pnenoi 

emulsion DNA reassociation technique 

(PERT) using thermal cycling" 

NUCLEIC ACIDS RESEARCH, 

vol. 23, no. 12, 1995, pages 2339-2340, 

XP002087175 

cite dans la demande 

voir le document en entier 


1,10 


A 


EP 0 791 660 A (SMITHKLINE BEECHAM CORP 
;UNIV WASHINGTON (US); UNIV SOUTH FLORIDA) 
27 aoQt 1997 

voir le document en entler 
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DIATCHENKO L ET AL: "SUPPRESSION 






SUBTRACTIVE HYBRIDIZATION: A METHOD FOR 






btNLKAIlNb UirrtKtNl 1ALLY KtbULATED OR 






TISSUE-SPECIFIC CDNA PROBES AND LIBRARIES- 






PROCEEDINGS OF THE NATIONAL ACADEMY OF 






SCIENCES OF USA, 






vol. 93, 1 juin 1996, pages 6025-6030, 






XP002911922 






cite dans la demande 






voir le document en entler 




A 


— 

PERRET E ET AL: "Improved differential 






screening approach to analyse 






transcriptional variations in organized 






cDNA libraries" 






GENE: AN INTERNATIONAL JOURNAL ON GENES 






AND GENOMES, 






vol. 208, no. 2, 22 fevrier 1998, page 






103-115 XP004114934 






voir le document en entler 




A 


— 

PELICCI G ET AL: "A NOVEL TRANSFORMING 






DDfiTTTM / CLIO N I1TTL1 AM CUO HAM ATM TO 

PROTEIN (5HC; WllH AN SHZ DOMAIN IS 






implicated™ mitogenic SIGNAL 






TRANSDUCTION" 






CELL, 






vol. 70, no. 1, 10 juillet 1992, pages 






93-104, XP002001630 






cite dans la demande 






voir abrege; figure 1 




A 


HARUN R B ET AL.: "Characterization of 






human SHC p66 cDNA and its processed 






pseudogene mapping to Xql2-ql3.1" 






GENOMICS, 






vol. 42, 1997, pages 349-352, XP002107843 






voir le document en entier 
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Cadre I Observations - lorsqu'il a ete estime que certalnes revendicatlons ne pouvaient pas faire I'objet d'une recherch< i 
(suite du point 1 de la premiere feuiile) 



Conformement a Tarticie 1 7.2)a). certaines revendtcations n'ont pas fait i'objet d'une recherche pour les motifs suivants: 

1. Les revendications n°* 

se rapportent a un objet a l'6gard duquel radministration n'est pas tenue de proceder a la recherche, a savoir 



□ 



□ 



Les revendfcations n°* 

se rapportent a des parties de la demande Internationale qui ne remplissent pas suffisamment les conditions prescrites pour 
qu'une recherche significative puisse £tre effectuee, en particulier 



Les revendtcations n°* 

sont des revendications d^pendantes et ne sont pas r&jigees conformement aux dispositions de la deuxieme et de la 
troisieme phrases de la regie 6.4.a). 



Cadre II Observations - lorsqu'il y a absence d'unite de Hnventfon (suite du point 2 de la premiere feuiile) 



L'administration chargee de la recherche Internationale a trouve plusieurs inventions dans la demande intemationaJe. a savolr: 



voir feuiile supplemental* re 



1 ■ I I Comme toutes les taxes additionnelles ont ete payees dans les delais par le d6posant. le present rapport de recherche 
1 — i internaoonale porte sur toutes les revendications pouvant faire i'objet d'une recherche. 



E 



Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu etre effectuees sans effort particulier 
justifiant une taxe additionnelle. radministration n'a sollicite le paiement d'aucune taxe de cette nature. 



3. I I Comme une parte seulement des taxes additionnelles demand6es a ete" payee dans les delais par le deposant. le present 
1 — ' rapport de recherche Internationale ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 
les revendications n os 



Aucune taxe additionnelle demandee n'a ete payee dans les ddlais par le deposant. En consequence, le present rapport 
1 — 1 de recherche intemationale ne porte que sur invention mentionrtee en premier lieu dans les revendications; elle est 
couverte par les revendications n 03 



Remarque quant a la reserve 



| | Les taxes additionnelles etaient accompagnees d'une reserve de la partdu deposar t. 
[~[ i-e paiement des taxes additionnelles n'etait assort d'aucune reserve. 
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SUITE DES RENSEIGNEMENTS INDIQUES SUR PCTASA/ 210 

L' administration chargee de la recherche internationale a trouve plusieurs 
(groupes d') inventions dans la demande internationale, a savoir: 

1. Revendicatlons: 1-47, 52-57 (complet) 

Des procedes d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences qualitatives entre deux 
echantillons (patho)biologiques, des oligonucleotides bons pour le 
clonage de ces acides nucleiques, des acides nucleiques identifies 
par ces procedes, des compositions et des banques comprenant ces 
acides nucleiques, des kits comprenant ces banques, r utilisation 
de ces acides nucleiques, compositions ou banques, un procede d' 
identification et/ou de production de proteines reliees a une 
condition pathologique, une proteine identifiee ou produite par ce 
procede ? un anti corps dirige contre cette proteine, un procede d* 
identification et/ou de clonage de genes suppresseurs de tumeurs, 
un procede de determination de la toxicite d'un compose, un procede 
de determination de Tefficacite therapeutique d'un compose, et un 
procede de determination de la reponse d*un patient a un compose. 

2. Revendications: 48-51 (complet) 

Une proteine de sequences SEQ ID N0:9, une sonde nucleique ou 
anti corps permettant d 4 identifier cette proteine, un procede de 
criblage, et un vecteur comprenant une sequence codant pour cette 
proteine. 
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DE 
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A 
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CA 
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T 


19-09- 
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EP 


0651822 


A 


10-05- 


1995 


EP 


0672130 


A 


20-09- 


•1995 


WO 


9402633 


A 


03-02- 


•1994 


JP 


2800850 


B 


21-09- 


•1998 


JP 


8500731 


T 


30-01- 


1996 


JP 


8506801 


T 


23-07- 


•1996 


US 


5830646 


A 


03-11- 


•1998 


US 


5879898 


A 


09-03- 


•1999 



AU 3300397 A 05-01-1998 



EP 0806478 A 12-11-1997 US 5747650 A 05-05-1998 

US 5726024 A 10-03-1998 



W0 9630512 A 03-10-1996 



FR 
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04-10- 


•1996 


AU 
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16-10- 
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BR 
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09-06- 


•1998 
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A 


03-10- 
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CZ 
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14-01- 
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A 
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28-08- 


■1998 


JP 


11503011 


T 


23-03- 


■1999 


NO 


974449 


A 


26-09- 


•1997 


SK 


131197 


A 
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